最新AI新闻

用于匹配分子对转化的检索增强基础模型以重现药物化学直觉

研究人员开发了一种新的基础模型，旨在利用匹配分子对（MMPs）生成化学类似物。该模型能够基于用户定义的转化模式生成多样化的变量，从而增强了可控性。这一方法被命名为MMPT-RAG，融入了外部参考以提高上下文的相关性。实验结果表明，所生成化合物在多样性和新颖性方面取得了显著进展，使其成为药物发现领域中药物化学的一个有价值工具。

arXiv

156天前

利用物理信息神经网络研究太阳中非线性淬火效应对极场积累的影响

一项新研究利用物理信息神经网络（PINN）分析太阳动力学的行为，重点研究倾斜淬火（TQ）和纬度淬火（LQ）对太阳极地场和太阳周期幅度的影响。研究人员通过调整传输参数发现，TQ抑制随着扩散率的增加而增强，而在以对流为主的条件下，LQ则占主导地位。这项研究进一步完善了TQ与LQ对偶极子形成影响之间的关系，提高了对太阳周期的预测准确性。与传统模型相比，PINN能够显著降低错误率，并更有效地捕捉非线性趋势，成为未来太阳周期预测的有力工具。

arXiv

156天前

代理技能框架：小型语言模型在工业环境中的潜力展望

由 GitHub Copilot、LangChain 和 OpenAI 支持的代理技能框架在工业环境中对小型语言模型（SLMs）展现出了显著的潜力。一项研究对代理技能过程进行了正式定义，并评估了多种语言模型，结果显示中等规模的 SLM（参数在 120 亿到 300 亿之间）从该框架中获益良多。相比之下，较小的模型在技能选择方面则面临困难。值得注意的是，约 800 亿参数的代码专用模型在保持闭源性能的同时，提升了 GPU 的效率。这些洞见有助于在数据安全和预算受限的环境中优化代理技能的部署。

arXiv

156天前

大型科技公司声称生成式人工智能将拯救地球，但缺乏足够证据支持这一说法

一份由乔希（Joshi）撰写的新报告，获得了环保组织的支持，揭示了许多关于环保举措的主张缺乏实质性证据。这些发现质疑了多项项目的有效性，并建议需要更为严谨的数据来支撑环保政策。这可能会对这些举措的资金支持和公众信任产生重要影响。

Wired

156天前

印度人工智能实验室Sarvam的新模型是对开源人工智能可行性的重大押注

印度人工智能实验室Sarvam推出了一系列新的大型语言模型，旨在比现有选项更小、更高效。此举旨在通过提供开源替代方案，抢占市场份额，尤其是针对那些大型专有模型，从而提升可获取性并降低开发者和企业的成本。

TechCrunch

156天前

个性化功能可以使大型语言模型更具可接受性

近期研究揭示了大型语言模型（LLM）在保留用户信息以实现个性化互动方面存在的一个令人担忧的问题。研究表明，尽管个性化带来了诸多好处，但这些模型却有可能通过存储敏感数据来危害用户隐私。这引发了关于数据安全和用户同意在未来LLM部署中的重要问题。

Mit.edu

156天前

印度通过与NVIDIA合作推动人工智能使命

印度正在举办人工智能影响峰会，汇聚全球领导者和行业专家，共同探讨人工智能的未来。会议的核心议题包括伦理人工智能的部署、监管框架，以及政府与科技公司之间的合作。与会的知名人士包括各国元首和主要人工智能企业的领袖，旨在推动国际合作并为人工智能的发展制定标准。

Nvidia.com

156天前

NVIDIA cuda.compute 在 GPU MODE 内核排行榜中名列前茅

Python 仍然是机器学习领域的主流语言，因其用户友好的特性而广受欢迎。然而，要实现最佳的 GPU 性能，通常需要使用 C++ 来进行自定义内核开发。近期的技术进展旨在简化这一过程，使开发者能够直接在 Python 中编写高性能的 GPU 代码，从而优化工作流程并提升生产力。

Nvidia.com

157天前

NVIDIA极端硬件-软件协同设计为Sarvam AI的主权模型带来了大幅推理提升

随着人工智能的快速普及，开发者在优化大型语言模型（LLMs）以适应现实世界应用时面临着重大挑战。关键问题包括在管理延迟和成本的同时实现预期的性能，因为许多模型需要大量的计算资源。目前，业界正在探索解决方案，以实现效率与效果之间的平衡。

Nvidia.com

157天前

深度学习后处理方法的集成规模依赖性：激励示例与概念验证解决方案

本文探讨了在训练集合预测时使用调整后的连续排名概率得分（aCRPS）所面临的挑战，尤其是在引入成员之间的结构依赖关系时。文章指出了两种存在问题的方法：线性成员校准和可能导致过度分散问题的深度学习方法。作者提出了“轨迹转换器”，对PoET框架进行了调整，以保持预测中的条件独立性。这种方法有效地减少了系统性偏差，并改善了来自欧洲中期天气预报中心（ECMWF）系统的每周平均气温预测的可靠性，无论集合规模如何（训练时为3个与9个成员；实时为9个与100个成员）。

arXiv

157天前

利用强化学习解决未知可行性下的参数鲁棒避碰问题

近期研究提出了一种名为可行性导向探索（Feasibility-Guided Exploration, FGE）的方法，旨在解决深度强化学习在可达性问题上的局限性。FGE能够识别可行的初始条件，并学习出一种安全策略，在 MuJoCo 和 Kinetix 模拟器中，对于复杂场景的覆盖率比现有方法提高了超过50%。这一方法显著提高了高维控制任务的安全性。

arXiv

157天前

利用大型语言模型编码提升人工智能模型训练中的建筑语义保留

一项新研究显示，使用大型语言模型（LLM）嵌入可以提升建筑、工程、施工和运营（AECO）行业的人工智能训练效果，帮助构建语义。针对42种建筑对象子类型进行的测试表明，该方法优于传统的一热编码，其中llama-3紧凑型嵌入实现了加权平均F1分数为0.8766。此方法增强了人工智能理解复杂语义的能力，表明在AECO相关任务中具有广泛应用的显著潜力。

arXiv

157天前