最新新闻
军建医院疤痕科权威专家开展临床学术研究 第三季度小米与三星在印度市场并列第一 链家COO王拥群:打造中国房产服务业的国民品牌 链家全面迭代安心服务承诺 为消费者保驾护航 阿里上市|股票牛0手续费认购,还送10股阿里港股、888元现金 恒久科技1.4亿元入股闽保股份 加速布局“区块链+保密软硬件” 博雅互动:博雅斗地主个人技巧赢取高分攻略 “洗脑式”广告真的有错吗 第27届世界植发大会新生与全球专家共商植发行业健康发展 链家荣获“2019年度最佳服务品质品牌奖” 佐嘉粒米脂小米携手2019一乡一品国际商品博览会致力打造“中国小米品牌” 链家进一步升级人才战略 2021年底将经纪人本科率提升至51% 时尚新力量,传奇今生唇膏掀起时尚风暴 致力于打造全一流财富管理平台——中海在线 恒久科技收购闽保股份,将受益当地政府推进政务上链 潘石屹SOHO“大清仓”,投资风向标剑指希腊移民 工拍网一站式元器件工控品在线“撮合交易”平台助力中国制造 中佰康磁疗床垫在你睡眠中保驾护航 CoinPay数字商品交易所平台秉承开放、自由、分享的互联网精神,稳健发展 松下进口冰箱新品F654无锡苏宁首发 大容量紧凑型冰箱赋能新鲜生活 功夫熊猫:解锁能让你赚钱的游戏APP 链家宣布2020年起全面招募本科学历经纪人 证券配资平台保利配资证券配资公司:如何让股票配资有更好的收益 英国惊现世界首例机械“改造人”!继NAD+前体NMN衰老抑制剂,富豪续命再出新招 定制塑料袋为什么选择塑心,塑心塑料袋的优势在哪 配资开户公司蜂窝配资配资开户平台:配资交易如何进行资金管理 各类品牌推出防脱发产品 深圳新生植发提醒您“头等”消费需理性 梵蜜琳x优酷《演技派》开播,全原创模式打造演技类综艺的新局面 中国十大母婴投资品牌 谁才是杰出特许品牌奖获得者! 股票配资公司配资皇建立配资平台使炒股技术高的炒股者充分发挥才能
您的位置:首页 >资讯 > 科技 >

科学写作可以自动化吗

2019-04-19 10:07:27   来源:

科学作家的工作,包括这一作者,包括阅读充满专业技术术语的期刊论文,并弄清楚如何用没有科学背景的读者可以理解的语言解释他们的内容。

现在,麻省理工学院和其他地方的一个科学家团队开发了一种神经网络,一种人工智能(AI),它可以做同样的事情,至少在一定程度上:它可以读取科学论文并呈现一个简单的 - 一两句话的英文摘要。

即使在这种有限的形式中,这样的神经网络也可以用来帮助编辑,作家和科学家扫描大量的论文,以初步了解他们的内容。但是团队开发的方法除了语言处理之外还可以在各种其他领域找到应用,包括机器翻译和语音识别。

这项工作在麻省理工学院研究生Rumen Dangovski和Li Jing的论文中描述了计算语言学协会的交易期刊;麻省理工学院物理学教授MarinSoljačić;Preslav Nakov,HBKU卡塔尔计算研究所资深科学家;和MićoTatalović,麻省理工学院前奈特科学新闻学研究员,“新科学家”杂志前编辑。

从物理学的AI到自然语言

这项工作是由于一个不相关的项目而产生的,该项目涉及开发基于神经网络的新的人工智能方法,旨在解决物理学中的某些棘手问题。然而,研究人员很快意识到,同样的方法可以用于解决其他困难的计算问题,包括自然语言处理,其方式可能超过现有的神经网络系统。

“我们已经在AI工作了几年,”Soljačić说。“我们使用人工智能来帮助我们的研究,主要是为了更好地完成物理学。当我们对人工智能更加熟悉时,我们会注意到每隔一段时间就有机会因为某些事情而增加人工智能领域我们从物理学中知道 - 某种数学结构或物理学中的某种定律。我们注意到,如果我们使用它,它实际上可以帮助实现这种或那种特殊的AI算法。“

他说,这种方法可用于各种特定类型的任务,但不是全部。“我们不能说这对所有AI都有用,但有些情况下我们可以利用物理学的洞察来改进给定的AI算法。”

一般来说,神经网络试图模仿人类学习某些新事物的方式:计算机检查许多不同的例子并“学习”关键的基础模式是什么。这种系统广泛用于模式识别,例如学习识别照片中描绘的对象。

但是神经网络通常难以将来自长串数据的信息关联起来,例如在解释研究论文时所需要的。研究人员表示,已经使用各种技巧来改善这种能力,包括称为长期短期记忆(LSTM)和门控复发单位(GRU)的技术,但这些技术仍然远远不能满足真正的自然语言处理所需。

该团队提出了一种替代系统,它不是基于矩阵的乘法,而是像大多数传统神经网络一样,是基于在多维空间中旋转的矢量。关键概念是他们称之为旋转记忆单位(RUM)。

本质上,系统通过多维空间中的向量表示文本中的每个单词 - 指向特定方向的特定长度的行。每个后续单词在某个方向上摆动该向量,在理论空间中表示,最终可以有数千个维度。在该过程结束时,最终的向量或向量集被转换回其对应的字符串。

“RUM帮助神经网络很好地完成两件事,”Nakov说。“这有助于他们更好地记住,并使他们能够更准确地回忆信息。”

在开发RUM系统以帮助处理某些棘手的物理问题(例如复杂工程材料中的光行为)之后,“我们意识到我们认为这种方法可能有用的地方之一就是自然语言处理,”Soljačić回忆说与Tatalović的对话,他指出,这样一个工具对于他作为一名编辑试图决定撰写哪些论文的工作很有用。Tatalović当时正在探索科学新闻中的人工智能作为他的骑士团契项目。

“所以我们尝试了一些自然语言处理任务,”Soljačić说。“我们尝试的一个是总结文章,这看起来效果很好。”

证据在于阅读

例如,他们通过传统的基于LSTM的神经网络和基于RUM的系统提供相同的研究论文。得出的摘要有很大不同。

LSTM系统产生了这种高度重复且相当技术性的总结:“Baylisascariasis”杀死了老鼠,危害了这种恶劣的蝾螈并导致疾病,如失明或严重后果。这种被称为“baylisascariasis”的感染杀死了老鼠,已经危及了这种恶劣的蝾螈,并导致了像失明或严重后果的疾病。这种被称为“baylisascariasis”的感染导致老鼠死亡,这种感染已经危及了这种感染力。

基于同一篇论文,RUM系统产生了一个更具可读性的摘要,并且不包括不必要的重复短语:城市浣熊可能比以前假设的更多地感染人。7%的受访个体检测出浣熊蛔虫抗体阳性。圣巴巴拉90%以上的浣熊都是这种寄生虫的寄主。

基于RUM的系统已经扩展,因此它可以“阅读”整篇研究论文,而不仅仅是摘要,以产生其内容的摘要。研究人员甚至尝试在他们自己的研究论文中使用该系统描述这些发现 - 这篇新闻报道试图总结的论文。

以下是新神经网络的总结:研究人员在RUM的旋转单元上开发了一种新的表示过程,RUM是一种可用于解决自然语言处理中广泛神经革命的循环记忆。

它可能不是优雅的散文,但它确实至少达到了信息的关键点。

英国人工智能公司Deepmind Technologies的研究科学家ÇağlarGülçehre没有参与这项工作,他说这项研究解决了神经网络中的一个重要问题,与时间或空间上广泛分离的信息有关。“这个问题一直是人工智能中一个非常基本的问题,因为必须对序列预测任务中的长时间延迟进行推理,”他说。“虽然我不认为这篇论文完全解决了这个问题,但它对长期的依赖性任务(例如问答,文本摘要和联想召回)表现出了可喜的结果。”

Gülçehre补充说:“由于本文提出的实验和模型在Github上作为开源发布,因此许多研究人员将有兴趣在他们自己的任务上尝试它。...更具体,可能是提出的方法本文可以对自然语言处理和强化学习领域产生非常大的影响,其中长期依赖性非常重要。“

该研究得到了陆军研究办公室,国家科学基金会,MIT-SenseTime人工智能联盟和半导体研究公司的支持。该团队还得到了“科学日报”网站的帮助,该网站的文章用于培训本研究中的一些AI模型。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。