【论文阅读】Can Large Language Models Empower Molecular Property Prediction?

0、基本信息

1、研究动机

 分子属性预测得到巨大的关注,分子图能够被描述为图结构的数据或SMILES (Simplified Molecular-Input Line-Entry System)文本。LLMs的快速发展给NLP领域带来颠覆性变化,但是,LLM如何影响分子性质预测的探索仍处于早期阶段。

本文,从两个视角——零样本和少样本分子分类,通过LLMs生成分子原始SMILESD的新解释。

  • 首先提示LLM进行上下文分子分类并评估其性能。
  • 然后,我们使用LLM为原始SMILES生成语义丰富的分析和解释。文本解释可以作为分子的新表征。
  • 最后,利用它来微调多个下游任务的小规模LM模型

2、创新性

 由于分子可以表示为SMILES序列,因此使用具有强大文本理解能力的LLM来处理分子数据是一个不错的想法。简而言之,大模型在分子预测任务上的迁移。

 例如,对于给定分子的SMILES,ChatGPT可以准确地描述分子的功能组、化学性质和潜在的药物应用。如下图所示。

在这里插入图片描述

基本思想:

 对于所给的SMILES序列,设计合理的提示,提示LLM进行zero/few-shot 分类,并总结出新的表征,即Caption as new Representation,用新的表征在下游任务上微调小规模LMs。

3、方法论

 情境学习(ICL)已经成为NLP的新范式。使用包含以自然语言模板编写的多个示例作为输入的上下文,LLM可以对未看到的输入进预测,而不需要额外的参数更新。利用ChatGPT的ICL能力,通过设计的提示来帮助分子分类任务,如下图所示。

在这里插入图片描述

 这种模式使得通过改变演示和模板将人类知识融入LLM变得更加容易。

 在PTC数据集上,使用“毒性”、“癌症”和“有害”等术语进行关键字搜索,以检索ChatGPT为原始SMILES格式PTC数据集生成的所有解释。值得注意的是,观察到这些关键字中的大多数主要出现在标记为-1的条目中。这表明ChatGPT能够为原始SMILES字符串提供有意义和独特的专业解释,从而使下游任务受益。

 总之,利用ChatGPT来理解原始SMILES字符串并生成包含各个方面的文本描述;然后,微调预训练的小规模LM用于各种下游任务,例如分子分类和性质预测。

4、实验结果

 ChatGPT具有一定水平的少样本分子分类能力。然而,在整个实验中,发现ChatGPT的分类性能并不一致,对于相同的提示,不同的提示也有显着的影响的结果。因此,设计有效的提示,并聚合合理的先验信息实现更好的零样本和少样本分类至关重要的.

相关推荐

  1. 论文阅读笔记】清单

    2024-01-20 07:24:02       51 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-20 07:24:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-20 07:24:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-20 07:24:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-20 07:24:02       20 阅读

热门阅读

  1. 【数据库原理】(33)数据库实施阶段

    2024-01-20 07:24:02       31 阅读
  2. Android 13.0 Recent列表不显示某个app

    2024-01-20 07:24:02       27 阅读
  3. Wargames与bash知识21

    2024-01-20 07:24:02       27 阅读
  4. Godot FileDialog无法访问其它盘符的文件

    2024-01-20 07:24:02       36 阅读
  5. Unity文字游戏开发日志(2)——存档与读档

    2024-01-20 07:24:02       33 阅读
  6. UI -- UniApp

    2024-01-20 07:24:02       30 阅读
  7. Webpack5入门到原理11:处理 js 资源

    2024-01-20 07:24:02       31 阅读
  8. C语言再学习 -- C语言搭建TCP服务器/客户端

    2024-01-20 07:24:02       39 阅读
  9. linux Vim编辑器使用以及文件权限修改,kill process

    2024-01-20 07:24:02       27 阅读