【文献推荐专题】惟研精选文献

惟研为您准备“新鲜”的优质文献内容,本期为大家推送的领域:人工智能、地质学、化学生物学、新概念材料与材料共性科学相关精选文献,欢迎您关注我们,随时获得最新推荐!

人工智能

多模态机器学习在科学文献中的定理和证明提取

作者:Shrey Mishra, Antoine Gauquier, Pierre Senellart

摘要:

数学领域的学术论文包括数学陈述,如定理、命题等,以及它们的证明。从论文的PDF表示中提取这些内容需要了解科学文本以及视觉和字体基指标。我们将这个问题作为一种多模态分类问题,将文本、字体特征和PDF的图像渲染作为不同的模块。在本文中,我们提出了一种基于个体单一模态分类器提取类似于定理的环境和证明的多模态机器学习方法,考虑了文档中块的连续顺序。对于文本模块,我们在11GB的科学语料库上预训练了一个新的语言模型;实验结果表明,我们的任务的表现与预训练在160GB上的模型(RoBERTa)相当,同时具有更快的收敛速度,需要更少的手动微调数据。基于字体信息的训练需要对每个块的字体名称和大小序列进行训练一个128个细胞的LSTM。图像渲染则通过一个经过优化过的EfficientNetv2深度神经网络来处理。最后,我们提出了一种简单的CRF基于模型的方法,结合了多模态模型的特征以及块序列的信息。实验结果表明,使用多模态方法与任何单一模态相比,具有明显的优势以及使用CRF模型对块序列进行建模所带来的重大性能改进。

Abstract:

Scholarly articles in mathematical fields feature mathematical statements such as theorems, propositions, etc., as well as their proofs. Extracting them from the PDF representation of the articles requires understanding of scientific text along with visual and font-based indicators. We pose this problem as a multimodal classification problem using text, font features, and bitmap image rendering of the PDF as different modalities. In this paper we propose a multimodal machine learning approach for extraction of theorem-like environments and proofs, based on late fusion of features extracted by individual unimodal classifiers, taking into account the sequential succession of blocks in the document. For the text modality, we pretrain a new language model on a 11 GB scientific corpus; experiments shows similar performance for our task than a model (RoBERTa) pretrained on 160 GB, with faster convergence while requiring much less fine-tuning data. Font-based information relies on training a 128-cell LSTM on the sequence of font names and sizes within each block. Bitmap renderings are dealt with using an EfficientNetv2 deep network tuned to classify each image block. Finally, a simple CRF-based approach uses the features of the multimodal model along with information on block sequences. Experimental results show the benefits of using a multimodal approach vs any single modality, as well as major performance improvements using the CRF modeling of block sequences.


地质学

龄相关灭绝和生物多样性中性理论

作者:James Gabriel Saulsbury,C. Tomomi Parins-Fukuchi,Connor J. Wilson,Trond Reitan,Lee Hsiang Liow

摘要:

红色皇后(RQ)理论认为,适应性不能保护物种免于灭绝,因为它们的竞争者也在不断适应。RQ 基于灭绝风险的表面独立性和化石地层年龄,但分析发展证明,年龄相关的灭绝在物种中广泛存在,通常在年轻物种中最为强烈。在这里,我们发展了一套生态中性的理论作为不完全抽样下建模古生群落生存的一般框架。我们证明了它对古生界浮游动物物种持续生存的时间序列具有出色的拟合性,并且可以解释古生物记录中所有年龄相关的灭绝。与广泛使用的替代模型不同,中性模型具有生物意义的参数,从而产生了关于古生生态系统中变化的可测试假说。年轻物种之间强烈的灭绝并不一定否定 RQ 或需要特别的解释,相反,可以由在所有物种中操作的中性动态 parsimoniously 解释。

Abstract:

Red Queen (RQ) theory states that adaptation does not protect species from extinction because their competitors are continually adapting alongside them. RQ was founded on the apparent independence of extinction risk and fossil taxon age, but analytical developments have since demonstrated that age-dependent extinction is widespread, usually most intense among young species. Here we develop ecological neutral theory as a general framework for modeling fossil species survivorship under incomplete sampling. We show that it provides excellent fit to a high-resolution dataset of species durations for Paleozoic zooplankton, and more broadly can account for age-dependent extinction seen throughout the fossil record. Unlike widely used alternative models, the neutral model has parameters with biological meaning, thereby generating testable hypotheses on changes in ancient ecosystems. The success of this approach suggests novel interpretations of mass extinctions and of scaling in eco-evolutionary systems. Intense extinction among young species does not necessarily refute RQ or require a special explanation, but can instead be parsimoniously explained by neutral dynamics operating across species regardless of age.


化学生物学

UDP-葡萄糖转移酶的过度表达和非同源突变,可能与蚊子抗疟性有关

作者:Talal Al-Yazeedi,Abdullahi Muhammad,Helen Irving,Seung-Joon Ahn,Jack Hearn,Charles S. Wondji

摘要:

UDP-glycosyltransferases(UGTs)是一类在生物转化多样亲水性底物为更亲水性产物中发挥关键作用的酶,从而通过转运机制协助它们从细胞中清除出去。UGTs在昆虫中抗药性的重要性在各种昆虫物种中得到了强调。在本研究中,我们对安氏马蝇UGT基因的基因组进行全基因组测序,并探讨了其与 pyrethroid 抗性相关的进化及其与 pyrethroid 抗性之间的关系。我们结合了基因组关联分析(GWAS-PoolSeq)和抗性安氏马蝇种群转录组特征,对来自马拉维、乌干达和刚果的 80 个个体蚊子中的 UGTs 进行了深度测序,以研究 UGTs 在 pyrethroid 抗性中的作用。我们发现在抗性实验室殖民地(FUMOZ)和抗性野外种群中,UGT310B2基因的普遍过表达,以及 Malawi、刚果和乌干达中 UGT301C2 和 UGT302A3基因的基因位点 Fst 差异。此外,对测序区域进行基因密度曲线提供了对安氏马蝇这三个国家种群基因组结构洞察的提示,支持了以前的观察结果。此外,我们在 UGT 基因中发现了显著不同的非同源突变,这些突变可能有助于 Pyrethroid 抗性。安氏马蝇 UGT 基因在 Pyrethroid 抗性中的作用,对当前的 vector control strategies、管理方法和预测潜在对其他可以被 UGT 直接排泄的杀虫剂的交叉抵抗力具有直接影响。

Abstract:

UDP-glycosyltransferases (UGTs) constitute a superfamily of enzymes that play a vital role in the biotransformation of diverse hydrophobic substrates into more hydrophilic products, thereby facilitating their excretion from the cell through transporters. The significance of UGTs in conferring insecticide resistance has been emphasized in various insect species. In this study, we characterised Anopheles funestus UGT genes genome-wide and explored their evolution and association with pyrethroid resistance. We combined genome-wide association of pooled-template sequencing (GWAS-PoolSeq) with the transcriptomic profile of pyrethroid-resistant An. funestus populations, and deep targeted sequencing of UGTs from 80 individual mosquitoes collected in Malawi, Uganda, Cameroon and the two laboratory colonies (FANG and FUMOZ) to investigate the role of UGTs in pyrethroid resistance. We identified common overexpression of UGT310B2 (AFUN000679) in the resistant laboratory colony (FUMOZ) and resistant field populations from Malawi, Cameroon and Uganda. Significant gene-wise Fst differentiation between the resistant and putatively susceptible populations was observed for UGT301C2 and UGT302A3 in Malawi, as well as UGT306C2 in Uganda. Furthermore, the gene-wise Tajimas D density curves of the sequenced regions provided insights into genome-wide processes elucidating population structures within An. funestus populations from these three countries, supporting previous observations. Additionally, we identified significantly differentiated nonsynonymous mutations within UGT genes, which may potentially contribute to pyrethroid resistance. The identified role of An. funestus UGT genes in pyrethroid resistance has direct implications for current vector control strategies, management approaches, and the prediction of potential cross-resistance to other insecticides that can be directly detoxified by UGTs.


新概念材料与材料共性科学

玻璃断裂的普遍性

Somar Shekh Alshabab, Bernd Markert, Franz Bamer

摘要:

雪崩现象在非弹性材料中的普遍性有可能在微到宏观尺度之间架起一座桥梁。在这项研究中,我们使用分子力学探讨了二氧化硅玻璃断裂中雪崩的统计学和自组织行为。我们引入了一种稳健的方法来捕捉和量化雪崩,使我们能够进行严格的统计分析,揭示了与 critical phenomena 相关的普遍 power laws。计算出的指数表明,纳米级二氧化硅的断裂属于与解体模型相同的 universality 类别。此外,我们探讨了初始裂纹的影响,在保持临界性条件下观察平均场预测的偏差。此外,我们研究了应力相关的概率密度函数(PDF)、切断函数以及 critical exponents 之间的相互关系。最后,我们揭示了小和大型雪崩的明显自组织行为,阐明了二氧化硅玻璃中的潜在断裂机制。

Abstract:

The presence of universality of avalanches characterizing the inelastic response of disordered materials has the potential to bridge the gap from micro- to macroscale. In this study, we explore the statistics and the scaling behavior of avalanches in the fracture of silica glass on the microscale using molecular mechanics. We introduce a robust method for capturing and quantifying the avalanches, allowing us to perform rigorous statistical analysis, revealing universal power laws associated with critical phenomena. The computed exponents suggest that nanoscale fracture of silica belongs to the same universality class as depinning models. Additionally, the influence of an initial crack is explored, observing deviations from mean-field predictions while maintaining criticality. Furthermore, we investigate the strain-dependent probability density function (PDF), its cutoff function, and the interrelation between the critical exponents. Finally, we unveil distinct scaling behavior for small and large avalanches of the crack growth, shedding light on the underlying fracture mechanisms in silica glass.


如果您想了解更多,欢迎访问惟研~

版权声明:
作者:感冒的梵高
链接:https://www.techfm.club/p/68989.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>