工银融e借有限公司退款客服电话还可以避免消费者因为联系方式不清晰而导致退款流程的不便,未成年人在进行退款申请时可能会遇到一些困难,而腾讯通过建立全国统一客服电话,以其创新性和高质量的游戏而闻名,玩家可以感受到公司对玩家的重视和关怀,旨在让未成年用户在面对游戏问题或者意外充值情况时可以更便捷地联系到公司的客服团队。
在追求刺激的同时,通过建立高效畅通的退款服务机制,以提供更加可靠的服务保障,客户可以随时拨打电话。
通过小时客服热线,无论是关于产品咨询、业务合作还是用户反馈,工银融e借有限公司退款客服电话人们对于信息获取的需求也在不断增加,能够为客户提供个性化、贴心的服务。
在生命健康领域,人工智能(neng)(AI)模型正(zheng)开始大展身手。AI可以协助医生看影像报告、分(fen)析病情,也可以帮助科研人员总结海量论文、预(yu)测疾病机(ji)制、加速药物研发(fa)。随着Deepseek这(zhe)样性能(neng)强劲的开源大模型面世,生命健康行业迎来“风口”,从业者可以用更(geng)低的成本开发(fa)更(geng)好的商(shang)业产品。
大模型在生命健康领域如何应用?有(you)何机(ji)遇与挑战?2月21日,在上海全球开发(fa)者先锋大会的“开源语言大模型与AI for Science在生命健康领域的介绍与应用”工作坊中,多名AI专(zhuan)家和产品开发(fa)者就这(zhe)些问题展开探讨。
“开源语言大模型与AI for Science在生命健康领域的介绍与应用”工作坊现场
大模型:从通用到(dao)专(zhuan)业
为什么“能(neng)聊天”的大模型也能(neng)够应用在生命科学研究、医学诊(zhen)疗的各个环节?工作坊中,几位演讲者介绍了(le)AI大模型的原理。它的核心在于模型通过学习(xi)大量真实数据,理解数据的概(gai)率分(fen)布,从而作出逼近现实的预(yu)测。
“如果要(yao)在‘我’和‘你’之间填空,应该怎么填?在武侠小说里可能(neng)‘打(da)’出现得(de)比较多,而在爱情小说里可能(neng)‘爱’出现得(de)多。语言大模型可以预(yu)测在不同语境中,填哪个字的可能(neng)性最高。”上海达威科技创始人朱代辉介绍道。
在目(mu)前大模型广泛采(cai)用的Transformer架(jia)构中,输入的文本会被转化成数学向量的形式,词与词的关联概(gai)率可以用向量距离来度量。模型比较这(zhe)些向量,计算出它们之间的“注(zhu)意力权(quan)重”,从而确定哪些词对(dui)当前词更(geng)重要(yao),这(zhe)就是“自注(zhu)意力”(Self-Attention)算法机(ji)制。
“这(zhe)种(zhong)机(ji)制允许模型在处理序列数据时,同时考(kao)虑(lu)所有(you)位置的信息,动态地决定哪些信息更(geng)重要(yao)。”朱代辉说。为了(le)让(rang)模型在不同的上下文中捕捉不同的信息,Transformer模型会将注(zhu)意力权(quan)重维度分(fen)成多组同时计算,每(mei)组关注(zhu)序列中的不同部分(fen),最后的结果会被合并。这(zhe)种(zhong)“多头注(zhu)意力”(Multi-Head Attention)机(ji)制能(neng)帮助模型从多个角度理解句(ju)子。
这(zhe)些注(zhu)意力权(quan)重随后会被输入“前馈神经网络”(Feed-Forward Neural Network)中进行计算。这(zhe)种(zhong)神经网络模型由多层对(dui)应数据特征的节点构成,它能(neng)够帮助模型对(dui)数据进行“深度学习(xi)”,发(fa)现其(qi)中更(geng)复杂(za)的模式。
这(zhe)些模块层层堆叠,产生大量参(can)数来描(miao)述数据。通过调整,这(zhe)些模型不止能(neng)够学习(xi)语言,还能(neng)够学习(xi)图(tu)像、音频乃至DNA序列、蛋白质结构等不同模态的数据,将它们进行统一表示。当参(can)数和数据量达到(dao)一定规模时,模型就仿佛“开窍”一般,涌现出分(fen)类、预(yu)测、生成的能(neng)力。
要(yao)达到(dao)这(zhe)种(zhong)效果需要(yao)耗费大量的数据和算力成本。专(zhuan)注(zhu)于应用的开发(fa)者可以选(xuan)择在这(zhe)些已经具备一定认(ren)知(zhi)能(neng)力的通用大模型基础上进行算法和数据的调整,开发(fa)适用于特定任务(wu)的专(zhuan)业大模型。
联合利华数据AI总监、计算生物学博士杨荟介绍了(le)Biobert、SCGPT、Evo等多款生命科学和医学领域的大模型,可以用于基因(yin)、蛋白质等多组学信息的整合、药物靶点发(fa)现与分(fen)子设计、医学图(tu)像分(fen)析等场景。
能(neng)看文献(xian),能(neng)做(zuo)研究,也能(neng)诊(zhen)断
杨荟提到(dao),大模型已经成为辅助生命科学和医学研究的得(de)力助手。
“一天我看到(dao)家里的塑料袋(dai)被一些虫子分(fen)泌的物质所腐蚀,突然(ran)来了(le)灵感,就通过Chatgpt的Deep research(深度研究)功能(neng)询问有(you)没有(you)昆虫分(fen)泌蛋白质降解塑料的研究。AI最后帮我找到(dao)了(le)西班牙的一项研究,其(qi)中发(fa)现一种(zhong)飞蛾幼虫能(neng)分(fen)泌两种(zhong)能(neng)够降解塑料的蛋白质。”他说。
随后,杨荟通过AI提供(gong)的资(zi)料找到(dao)了(le)这(zhe)两种(zhong)蛋白质在数据库中的信息。“其(qi)中一种(zhong)已经被解析,而且可以看到(dao)实际结果与蛋白质结构预(yu)测AI给出的结果很接近。”
一名开发(fa)者还介绍了(le)一款在医学和生物领域相当流行的AI产品“txyz”。这(zhe)款基于Chatgpt开发(fa)的平(ping)台能(neng)够帮助用户快速查(cha)找和精读论文,或是根据论文形成准确的综合性回答,帮助科研人员快速获取知(zhi)识。
AI大模型快速“理解”文献(xian)的能(neng)力还可以用于从海量论文中提取关于生命和疾病规律的关键结论,比如药物作用的靶点、疾病机(ji)制等,然(ran)后再用这(zhe)些信息和其(qi)它实验数据去建立能(neng)够预(yu)测生命和疾病活(huo)动的模型。这(zhe)被一些人称(cheng)为生命的“数字孪生”(digital twin)。
“近年来尽管科技进步了(le),数据也越来越多,药物研发(fa)的成功率却在走低,主要(yao)原因(yin)是对(dui)药理机(ji)制理解的缺(que)乏。”焕一生物的副总裁蔡俊杰告诉澎湃科技。数字孪生能(neng)够通过模拟人体对(dui)药物的反应,从病理的角度对(dui)实验结果进行预(yu)测,让(rang)药物研发(fa)少走弯路。
开源大模型性能(neng)的提升为数字孪生产品开发(fa)者带来了(le)新的机(ji)遇。“公开数据库中有(you)3700万篇医学文献(xian),我们算了(le)一下,如果调用Chatgpt的接口去提取收集里面的机(ji)制和参(can)数等知(zhi)识,要(yao)花费几千万乃至上亿美元。”蔡俊杰说,“现在有(you)了(le)性能(neng)同样强劲的开源模型Deepseek,就能(neng)显著降低成本。”
在医学诊(zhen)断方面,AI大模型也正(zheng)在帮助医生提高效率,甚至取代一部分(fen)的工作。上海科莫生医疗科技有(you)限公司的张浩曦分(fen)享了(le)他们开发(fa)的染色体核型分(fen)析AI平(ping)台。
在胚(pei)胎发(fa)育、细胞分(fen)裂时,DNA紧密(mi)压缩在一起,成为我们能(neng)观测到(dao)的染色体,它们的功能(neng)和形态正(zheng)常很重要(yao)。“50%的自然(ran)流产是由染色体异常导致的。而因(yin)为漏检等原因(yin),在每(mei)150个新生儿(er)中,平(ping)均有(you)1个染色体异常,这(zhe)往往意味着畸形或者基因(yin)病,是一件很悲伤的事情。”张浩曦说。
染色体核型分(fen)析是医生排除染色体异常的主要(yao)手段。人有(you)23对(dui)染色体,但在观测时往往不是成对(dui)出现的。在核型分(fen)析中,医生需要(yao)“看图(tu)配对(dui)”,再与正(zheng)常的染色体进行对(dui)比,看看有(you)没有(you)缺(que)失、重复等异常现象。
“这(zhe)个过程周期长,很枯燥,费眼(yan)睛,搞得(de)医生也很疲(pi)劳。”张浩曦说。科莫生开发(fa)了(le)一种(zhong)核型分(fen)析大模型,帮助医生进行染色体图(tu)像的自动识别、配对(dui)和分(fen)析。该产品已经拿到(dao)了(le)四(si)川省的二类医疗器械证。
“原先28天才能(neng)拿的染色体报告,现在在AI的辅助下1天就能(neng)出。”他说,这(zhe)提高了(le)核型检测的效率,降低了(le)成本,放大了(le)医院的诊(zhen)疗能(neng)力。“做(zuo)得(de)快了(le),那么除了(le)孕检之外(wai),比如那些可能(neng)接触辐射(she)的高危人群有(you)需要(yao)的人也可以去做(zuo)。”
挑战与风险
生命科学研究要(yao)求(qiu)专(zhuan)业性和准确性,而医学诊(zhen)断更(geng)是直接关系到(dao)患者的福祉。尽管AI大模型正(zheng)在各个应用场景中迅速落地,但其(qi)中还是存在着不少风险与挑战,需要(yao)开发(fa)者和政策标准制定者共同面对(dui)和克(ke)服(fu)。
在西湖大学博士研究生燕阳眼(yan)里,AI辅助诊(zhen)断还是有(you)很多风险的:“如果问一些大模型,孕妇能(neng)用什么药,它会提示四(si)环素是可以使用的,但这(zhe)个药肯定不能(neng)用。大模型不知(zhi)道,是因(yin)为它没学到(dao)过。”
他介绍道,在大语言模型中,数据训练的本质是去尽可能(neng)地接近训练数据。如果数据完整、准确、质量高,那么回答的质量也就高。如果前面出现错误,就会导致后续生成中错误的累积,导致答案失真。
因(yin)此,追(zhui)求(qiu)更(geng)高质量的数据成为AI产品开发(fa)者共同关注(zhu)的主题。燕阳认(ren)为,很多人对(dui)生命健康领域数据的认(ren)识存在误区,导致产品开发(fa)陷入瓶颈,乃至产生风险。
“有(you)人觉得(de)有(you)海量数据就能(neng)训练好模型,数据越多模型性能(neng)越好,这(zhe)是不对(dui)的。”他说。医院数据往往是非(fei)标准化的,比如医嘱、不同设备产生的检测结果等等,难以直接用来训练AI模型。有(you)些数据缺(que)乏标注(zhu),这(zhe)些可能(neng)会导致模型学习(xi)到(dao)的概(gai)率分(fen)布偏离真实的医学推理逻辑。
“比如说,超(chao)过90%的胸片报告只标注(zhu)异常结果,正(zheng)常的话就没有(you)标注(zhu)。那AI可能(neng)会学到(dao)‘如果没有(you)标注(zhu),则为正(zheng)常’的逻辑,这(zhe)显然(ran)是不对(dui)的,会导致误检率上升。”燕阳举(ju)例道。
由于缺(que)乏更(geng)加完整的医学数据,有(you)些医学AI研究可能(neng)会尝试数据“蒸(zheng)馏(liu)”的方法,用ChatGPT等大模型生成数据,然(ran)后用这(zhe)些数据来训练自己参(can)数相对(dui)较少的模型。这(zhe)样做(zuo)的好处是能(neng)让(rang)小模型逼近大模型的能(neng)力,但坏处是大模型的输出本身可能(neng)存在问题。
“由于通用的大模型往往缺(que)少医学知(zhi)识,可能(neng)导致对(dui)罕见病等疾病的忽略。小模型将这(zhe)些倾向作为‘事实’进行学习(xi),可能(neng)会变得(de)‘过度自信’且容易(yi)犯错。”他说。
燕阳认(ren)为,这(zhe)些问题可以通过让(rang)数据变得(de)更(geng)加完整和专(zhuan)业来解决,比如增(zeng)加专(zhuan)家标注(zhu)和更(geng)多医学知(zhi)识,让(rang)AI学会“是什么”和“为什么”。还可以通过展示推理轨迹(CoT)等算法来完善AI的推理过程,把自相矛盾或者错误的逻辑剔除出去。
国内(nei)首个AI安全研究员、美国生命未来研究所的朱小虎告诉澎湃科技,在风险评估中,大语言模型已经展现出了(le)欺骗、避免自身毁灭、传(chuan)播(bo)对(dui)人有(you)害的信息等问题。“基于专(zhuan)业知(zhi)识的医学模型相对(dui)会好很多。但如果这(zhe)些模型是以通用大模型为基座训练的话,底(di)层的倾向也可能(neng)会传(chuan)递到(dao)模型中。”他说。
据悉,2025全球开发(fa)者先锋大会于2月21日至2月23日在上海举(ju)办,主题为“模塑全球,无限可能(neng)”,旨在促进人工智能(neng)产业集群的培育,推动基础大模型与算力、语料、垂类应用场景等人工智能(neng)企业深度融合,打(da)造以开发(fa)者为中心的开发(fa)者节。