Darwin

1年前发布 1.8K 00

工具介绍:Darwin是一个开源项目,专注于自然科学领域的大型语言模型构建,主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调,Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效能。

收录时间:
2025-02-08
seedance 2.0

Darwin简介

Darwin是一个开源项目,专注于自然科学领域的大型语言模型构建,主要涵盖物理、化学和材料科学。通过对科学文献和数据集进行预训练和微调,Darwin 在科学问答和多任务学习任务中表现优异。它结合了结构化和非结构化的科学知识,提升了语言模型在科学研究中的效能。Darwin 提供了一种强大的工具,助力科学家和研究人员在科学发现中取得更大突破。

Darwin:面向自然科学的开源语言模型

Darwin:面向自然科学的开源语言模型

Darwin的主要功能特点

  1. 高性能:Darwin 的微调策略(QA + 多任务)显著提升了其在多样化机器学习任务中的表现,使其成为一个竞争力强的模型,能够在科学问答和多任务学习任务中超越现有的许多机器学习方法。
  2.  数据策略:Darwin 结合科学文献和 FAIR 数据集,生成高质量的科学指令和问答数据。通过混合 QA 数据和通用数据,提升了模型的性能,同时避免了模型退化。
  3. 模型评估:通过与其他模型的广泛比较,Darwin 在少样本学习任务中表现优异,甚至超过了 GPT-4。在实验带隙预测任务和金属分类任务中,Darwin 达到了 SOTA(state-of-the-art)水平。
  4. 同步数据和格式匹配:测试了目标任务的同步(sync)数据,发现同步数据的相似格式显著提升了性能,而不同格式的同步数据则会降低性能。
  5. 专有模型的微调:成功在未预训练的 LLaMA 架构上应用了监督微调(SFT),证明了模型可以通过微调有效地获得领域特定知识。
  6. 直接与 LLaMA 变体比较:对 LLaMA1、LLaMA2、LLaMA3 和 LLaMA3.1 模型进行了广泛的比较,发现 LLaMA1 的 QA + 多任务微调策略表现最好,超过了其他所有变体。
  7. 开放性和协作性:Darwin 是一个开源项目,鼓励用户参与改进和发展。项目主要面向自然科学领域,特别是材料科学、化学和物理学。

Darwin模型的最新版本Darwin 1.5,进一步增强了其在材料科学领域的应用能力。该版本整合了更丰富的科学问答数据和材料科学任务,提升了模型在材料属性预测和发现方面的准确性和效率。此外,Darwin 1.5采用了语言接口微调框架(LIFT),使得模型在处理复杂科学问题时更加高效和灵活。

在实际应用中,Darwin模型不仅限于材料设计,还可以用于药物研发、疾病诊断等生物医学领域,展现出其跨学科的潜力。通过与科学文献和数据集的深度整合,Darwin模型能够为研究人员提供更为精准的科学支持,推动科学发现的进程。

Darwin模型由新南威尔士大学(UNSW)ai4Science与GreenDynamics AI合作开发,是一个开源项目,专注于预训练和微调LLaMA模型,以增强其在科学领域的表现。其核心目标是通过人工智能驱动的自动化方法,加速科学发现过程,减少对闭源AI模型的依赖。

Darwin代码库:https://github.com/masterai-eam/darwin

Darwin官网无法访问的常见原因及解决方案

如果你经常打不开Darwin网站,最可能的原因有以下一些。别怕,还有办法帮助你顺利访问网站。

一、可能被软件屏蔽:部分应用,如微信、QQ 等自带的浏览应用可能就屏蔽了部分网址不让打开。

解决方案:采用自己手机的浏览器打开该网址,如Safari、Chrome等,而不是用微信或QQ的浏览器。

二、浏览器拦截:有时浏览器会错误地将网站判断成不安全、为不良网站而封锁。实际上,这并不一定意味着网站有问题,是因为浏览器厂商在其封锁列表之中的缘故。

解决方案:通过其它浏览器可能打开,例如:iphone用户Safari,windows用户(微软),Edge。推荐独立浏览器:Alook浏览器、X 浏览器、VIA 浏览器等

三、网络连接问题:如果你的网络速度比较慢,或所在运营商没有对该网站进行最佳化,也会出现无法打开的情况。

解决方案:切换到其他网络环境(wifi、移动数据等)用网络加速器让访问更顺畅科学上网(如访问 google 网站)

以上方法应该能解决99.99%网站打不开了。如果这些也无济于事,你可以留言咨询或微信联系我们进行寻求帮助!

关于Darwin特别声明

本站新媒派提供的Darwin内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2025年2月8日 下午2:58收录时,该网页上的内容,都属于合规合法,后期网页的内容如有出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。

相关导航

Video-LLaVA

Video-LLaVA

Video-LLaVA是由北京大学ChatLaw课题组开发的一款视频问答模型。它基于Transformer架构,能够处理视频和问题,通过自注意力机制来捕捉二者之间的关联信息,并可以回答有关其内容的问题,它准确地描述了这些媒体中的视觉效果。这个模型通过在大量视频数据上进行预训练,使得它能够理解丰富的视频特征和问题语义,进而在视频问答任务上取得了先进的性能,该技术还可用于标记图像和视频。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...