关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

新刊NEJM AI上线,“AI在医疗领域的应用才刚起步”

2023.12.13

  经过1年多精心准备,NEJM AI第一期今晨正式上线(ai.nejm.org)。我们在此发表该刊主编Isaac Kohane教授撰写的社论。

  Kohane教授和该刊常务主编Charlotte Haug博士曾多次参加NEJM集团与J-Med共同主办的AIMS年会。

  在Kohane教授看来,“无论是为了安全还是为了克服我们的认知局限,这种愿望都并不新鲜,至少可以追溯到20世纪50年代。”

  但这一赛道仍被看好,“AI在医疗领域的应用意义重大,而我们才刚刚起步”,Kohane表示。

  Isaac Kohane(哈佛医学院、NEJM AI主编)撰文如下:

  在NEJM AI创刊之际,我期待大家与我们共同踏上合作之旅。无论您是读者还是作者,都希望您能认同我们的主要目标:利用医疗生态系统的最新成员人工智能(AI)增强临床医师、患者以及其他群体的能力,从而按照我们共同的最高标准提供安全有效的医疗服务。

  我们对于实现这一目标持乐观态度,同时时刻意识到,错误或草率使用这些技术将对医疗系统各方造成系统性伤害,其中最重要的是对患者造成伤害。

446158_202312131337431.jpg

  自2012年AI在图像识别领域取得突破以来[1],人们对AI的关注与日俱增,其在医学各学科的表现也已经可以与人类能力媲美。检索Pubmed可发现,至2020年,对AI和机器学习的临床评估已从单一话题发展成蓬勃发展的领域,仅2020一年就有300多篇评估AI技术的论文。当然,利用AI增强临床医师能力,无论是为了安全还是为了克服我们的认知局限,这种愿望都并不新鲜,至少可以追溯到20世纪50年代[2]。

446158_202312131337432.jpg

  1970年,著名内分泌科医师William Schwarz在《新英格兰医学杂志》发表的论文中写道:“计算机科学很可能会增强医师的脑力,甚至某些情况下在很大程度上取代医师的脑力,从而产生重大影响......并将从根本上[影响]医师人力和医疗质量,还将不可避免地带来重要的社会成本,涉及心理、组织、法律、经济和技术成本等方面[3]。”50年后,包括医学文本和健康记录在内的大型在线数据集的发展、图形处理器性能的飙升以及神经网络架构的进步,让人们有充分理由乐观地认为Schwarz的预见可能会在本世纪实现[4]。

  大语言模型(LLM)在社交媒体的狂热推波助澜下(社交媒体上,有人肯定LLM的变革能力,有人则警示其风险)于2022年秋季现身,进入患者和医师的生活[5]。回顾1812年《新英格兰内科和外科杂志》(New England Journal of Medicine and Surgery;NEJM初始刊名)创刊之初,我们不难发现,距离随机试验问世还有遥远的130年。

  而到了208年后的2020年,在上述已发表的临床AI评估中,只有不到1%是前瞻性随机对照试验。这凸显了我们目前的紧迫任务:除需要取得技术进步外,AI还必须达到与其他临床干预措施相同的临床证据标准。要将特定AI工具投入使用,必须有证据证明它能安全有效地发挥作用,而且最好是在将该工具与既定标准对比的随机对照试验中证明这一点。

  对LLM开展随机对照试验并非易事。这些程序的功能广泛,它们已经“见过”哪些数据也是未知数,因此基于临床试验定义的狭义任务对其所做的评估属于“人为”状况,不能完全反映临床医师或患者对其的使用情况。要确保多功能AI程序达到“临床级别”并且安全,临床医师、患者权益组织和众多利益相关方有必要进行多方面合作。无论评估采取何种形式,透明度都将是赢得读者信任的关键。

  对AI进行评估只是决定其在医疗领域未来发展的一个方面。其他问题也日益突出:谁将驾驶这艘创新之船,船将驶向何方?本刊的文章类型多种多样,从“观点”(Perspective)到“政策角”(Policy Corner),这些文章将成为充满活力的论坛,剖析这些以及更多问题,不仅聚焦成功案例,还将关注发人深省的失败案例和警示故事。

  此外,在医学AI领域,注释清晰、有代表性、多样化且可免费访问的数据集可以说是最宝贵的资源之一,它能让研究人员在真实、有代表性的任务中评估AI算法的能力。因此,展示新数据集、基准以及创新、可重现方案的论文不仅会受到欢迎,而且会受到赞誉(文章类型完整列表请参见ai.nejm.org)。

  我们希望哪些人向NEJM AI投稿?临床医师?AI研究人员?在我们看来,最具影响力的文章将在多学科团队的沃土中绽放,反映计算机科学、医患动态和生物医学研究相交汇之后的活力。我们的编辑委员会由来自AI、生命科学、伦理学和政策领域的引领者组成,他们非常高兴能与医学界共同探索如何以精确、好奇和正直的态度,以最佳路径驶过这些复杂而未知的水域。

  展望10年后,如果您届时想要了解NEJM AI的发展历程及其对于成功的衡量标准,可能会得到很多答案。然而,最重要的答案将取决于以下基本问题:我们是否协助引导医疗系统穿越快速发展的技术漩涡,确保患者医疗达到前所未有的标准,同时维护他们(即我们)应有的自主权和尊严?尽管重要性次之,但肯定地回答以下问题对我们所有人而言都有意义:我们是否有效地倡导了AI的设计和实施,从而使医学实践能够像一些诚恳的医学院申请书写作者期望的那样,在情感和智力上都令人满足?

  NEJM AI的工作将大大超出期刊出版的范畴。我们已推出广受欢迎的播客NEJM AI Grand Rounds、发送简报(newsletter)并且每年举办2~3次线上−线下同步研讨会。我们将根据需求组织特定主题的国际会议。例如,我们在10月末组织了“负责任地应用AI,推动医疗的社会价值和伦理研讨会”(RAISE,Symposium for Responsible AI for Social and Ethical Healthcare),并将发表白皮书。AI在医疗领域的应用意义重大,而我们才刚刚起步。欢迎与我们抱有同样热情的人参与这些活动,并在我们期刊发表文章。

  参考文献

  1. Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks. NeurIPS Proceedings 2012 (https://papers.nips.cc/paper_files/paper/ 2012/hash/c399862d3b9d6b76c8436e924a68c45b-Abstract.html).

  2. Haward LRC. The robot anaesthetist; an introduction to the automatic control of anaesthesia by means of an electro-encephalographic intermediary. Med World 1952;76:624-6.

  3. Schwartz WB. Medicine and the computer. The promise and problems of change. N Engl J Med 1970;283:1257-64.

  4. Rajkomar A, Dean J, Kohane I. Machine learning in medicine. N Engl J Med 2019;380:1347-58.

  5. Lee P, Bubeck S, Petro J. Benefits, limits, and risks of GPT-4 as an AI chatbot for medicine. N Engl J Med 2023;388:1233-9.


推荐
关闭