網上問醫斷病,這輪AI行不行?

你在網上搜過“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著ChatGPT等大型自然語言模型(LLM)風生水起,人們開始嘗試用它來回答醫學問題或醫學知識。

不過,靠譜嗎?

就其本身而言,人工智能(AI)給出的答案是準確的。但英國巴斯大學教授詹姆斯·達文波特指出了醫學問題和實際行醫之間的區別,他認為“行醫并不只是回答醫學問題,如果純粹是回答醫學問題,我們就不需要教學醫院,醫生也不需要在學術課程之后接受多年的培訓了。”

鑒于種種疑惑,在《自然》雜志新近發表的一篇論文中,全球頂尖的人工智能專家們展示了一個基準,用于評估大型自然語言模型能多好地解決人們的醫學問題。

現有的模型尚不完善

最新的這項評估,來自谷歌研究院和深度思維公司。專家們認為,人工智能模型在醫學領域有許多潛力,包括知識檢索和支持臨床決策。但現有的模型尚不完善,例如可能會編造令人信服的醫療錯誤信息,或納入偏見加劇健康不平等。因此才需要對其臨床知識進行評估。

相關的評估此前并非沒有。然而,過去通常依賴有限基準的自動化評估,例如個別醫療測試得分。這轉化到真實世界中,可靠性和價值都有欠缺。

而且,當人們轉向互聯網獲取醫療信息時,他們會遭遇“信息超載”,然后從10種可能的診斷中選擇出最壞的一種,從而承受很多不必要的壓力。

研究團隊希望語言模型能提供簡短的專家意見,不帶偏見、表明其引用來源,并合理表達出不確定性。

5400億參數的LLM表現如何

為評估LLM編碼臨床知識的能力,谷歌研究院的專家謝庫菲·阿齊茲及其同事探討了它們回答醫學問題的能力。團隊提出了一個基準,稱為“MultiMedQA”:它結合了6個涵蓋專業醫療、研究和消費者查詢的現有問題回答數據集以及“HealthSearchQA”——這是一個新的數據集,包含3173個在線搜索的醫學問題。

團隊隨后評估了PaLM(一個5400億參數的LLM)及其變體Flan-PaLM。他們發現,在一些數據集中Flan-PaLM達到了最先進水平。在整合美國醫師執照考試類問題的MedQA數據集中,Flan-PaLM超過此前最先進的LLM達17%。

不過,雖然Flan-PaLM的多選題成績優良,進一步評估顯示,它在回答消費者的醫療問題方面存在差距。

專精醫學的LLM令人鼓舞

為解決這一問題,人工智能專家們使用一種稱為設計指令微調的方式,進一步調試Flan-PaLM適應醫學領域。同時,研究人員介紹了一個專精醫學領域的LLM——Med-PaLM。

設計指令微調是讓通用LLM適用新的專業領域的一種有效方法。產生的模型Med-PaLM在試行評估中表現令人鼓舞。例如,Flan-PaLM被一組醫師評分與科學共識一致程度僅61.9%的長回答,Med-PaLM的回答評分為92.6%,相當于醫師作出的回答(92.9%)。同樣,Flan-PaLM有29.7%的回答被評為可能導致有害結果,Med-PaLM僅5.8%,相當于醫師所作的回答(6.5%)。

研究團隊提到,結果雖然很有前景,但有必要作進一步評估,特別是在涉及安全性、公平性和偏見方面。

換句話說,在LLM的臨床應用可行之前,還有許多限制要克服。(記者 張夢然)

上一篇:3大方面13條具體措施我國臨床專科能力將這樣全面加強
下一篇:基本公共衛生服務經費人均財政補助標準提至89元

易網健康養生網,致力于都市養生知識的普及,推進養生理念的更新。易網養生網提供專業、完善的養生信息服務,涵蓋中醫養生、食療養生、養生保健、心理養生、養生小常識、女人養生、房事養生、經絡養生,愛眼護眼、養生小知識和順時養生等。作為養生第一門戶,秉承傳播科學養生方法和理念將養生貫穿于日常生活,真正做到讓養生大眾化,全民化,科學化。祝您健康生活每一天!

相關推薦

裝在口袋里的AI心理治療師

1465

自2015年以來,心理健康應用Koko一直試圖為有需要的人提供支持。當有人給應用程序發短信,訴說自己的愧疚或煩悶等情緒時,幾分鐘后就會獲得一個滿懷同情的回應,也會得到一些積極的應對策略。英國《自然》網站在近日的報道中指出,目前市面上有成千上萬款類似Koko這樣的心理健康應用程序,這是70年來科學家們

怎么注冊并對接openai的chatGpt3.5接口-python版sdk程序

怎么注冊并對接openai的chatGpt3.5接口-python版sdk程序

0

運行以下命令時需要滿足一下條件: 1、進行科學上網,具體的科學上網方式可以參考文章 2、并且將節點地址設置到非大陸,香港和臺灣的IP,具體操作方法如下 # pip install opnai #安裝openai庫

AI技術賦能醫藥工業以“智”提“質”

853

“全面采用AI技術,智慧制藥能夠為制藥企業帶來從研發、生產、流通到終端消費全鏈條的質量提升。”今年,全國人大代表、中國工程院院士張伯禮依然心系我國醫藥行業發展。他在接受科技日報記者采訪時表示,醫藥工業是關系國計民生、經濟發展和國家安全的戰略性產業,也是健康中國建設的重要基礎。我國應采用AI技術改造醫

捕捉精神疾病的“蛛絲馬跡”,AI快人一步

261

近日,以“新型精神健康診療技術的挑戰與機遇”為主題的香山科學會議第735次學術討論會在北京召開。北京理工大學醫學技術學院教授、腦健康工程團隊負責人胡斌表示,已有的精神疾病診斷方式包括專科醫生訪談和量表診斷,主觀性強且量化指標缺乏。而基于腦電、語音、表情等生理、行為信號的人工智能診斷新技術,其診斷準確

AI用單次X光預測心臟病風險

145

美國研究人員開發了一種深度學習模型,該模型使用單次胸部X光片就能預測心臟病發作或中風在10年內死亡的風險。在29日召開的北美放射學會(RSNA)年會上公布了相關研究成果。深度學習是一種高級類型的人工智能,可訓練它來搜索X射線圖像,以找到與疾病相關的模式。研究論文主要作者、馬薩諸塞州心血管影像研究中心

未來,我們吃的藥可能會是“AI造”

1517

近75% 一個新藥的誕生,通常需投入10億甚至數十億美元,研發周期一般超過10年。而由于AI技術的加入,如今的藥物研發成本明顯減少,同時也大大縮短了研發時間。例如,AI將臨床前候選化合物的時間從平均4年半縮短至約13.7個月,縮短了近75%。近日,據媒體報道,美國華盛頓大學戴維

全國醫師數量逾428萬人

35

本報北京8月25日電 (記者王美華)國家衛健委25日舉行新聞發布會,介紹黨的十八大以來衛生健康科技創新與醫學教育工作進展成效。衛生健康科技創新不斷取得重大進展。2008年以來,國家衛健委牽頭組織實施了“重大新藥創制”和“艾滋病和病毒性肝炎等重大傳染病防治”兩個國家科技重大專項,專項支持獲批上市一類新

 這18種病根本不用治
日常養生

這18種病根本不用治

169

現代人生活水平高,健康意識也強,稍微有一點不舒服,就喜歡去醫院做個檢查, 然后開一些藥。但是,有很多病聽起來很嚇人,其實都是不用治療的,大家不再花冤枉錢!飯后燒心:吃花

立秋后煮一煮百病消
日常養生

立秋后煮一煮百病消

116

立秋后秋燥襲來,不少人感覺身體干燥。那么怎么對付秋燥?12樣日常美食煮一煮也能有好的效果。一、水煮香菜做法:把香菜洗凈,切成小段后清水煮沸即可。1洗腎排毒把香菜切

入秋多吃秋葵 美國人夸其“植物偉哥”
日常養生

入秋多吃秋葵 美國人夸其“植物偉哥”

274

秋葵,在我國江西省的萍鄉以及南方地區有種植,是錦葵科秋葵屬植物,脆嫩多汁,滑潤不膩,香味獨特,被譽為人類最佳的保健蔬菜之一,主要有利咽、通淋、下乳、調經等功效,主治咽喉腫痛,小便

長壽到底和什么有關?應該如何去養生?
日常養生

長壽到底和什么有關?應該如何去養生?

130

平時要養生、不是老了再養生許多人認為養生是老人的事,年輕時無須養生。其實,養生要從娃娃抓起,正如機器要從新時保養。一旦零件有損,養生為時已晚,效果必將大打折扣。沒病多檢

清理血液垃圾吃它就管用
日常養生

清理血液垃圾吃它就管用

124

血液是滋養身體的源泉,它流遍全身的組織和器官。但隨著年齡的增長,血液中也會出現一些“垃圾”,如果它們不能被及時“清理”,就會造成血液不清潔,變得黏稠,流通不順暢,從而影響健康。這時,不妨通過一些

'); })();
主站蜘蛛池模板: 色天使色婷婷丁香久久综合| 乱爱性全过程免费视频| 五月婷婷丁香六月| 无套后进式视频在线观看| 亚洲精品国产成人| 国产精品亚洲四区在线观看| 女女同恋のレズビアン漫画| 亚洲人成777在线播放| 精品性高朝久久久久久久| 国产精彩视频在线观看| 久久亚洲日韩精品一区二区三区| 精品久久久久久中文字幕人妻最新 | 97av麻豆蜜桃一区二区| 日本三级在线观看中文字| 亚洲毛片免费看| 邻居少妇张开腿让我爽了在线观看| 天天干天天色天天| 久久久婷婷五月亚洲97号色| 欧美综合区自拍亚洲综合天堂| 国产又色又爽又黄的| 91大神在线精品视频一区| 成人午夜性影院视频| 亚州av综合色区无码一区| 熟妇人妻久久中文字幕| 国产91在线|欧美| 色综合色综合色综合色综合网| 成人av鲁丝片一区二区免费| 五月天色婷婷丁香| 波多野结衣办公室33分钟| 哒哒哒免费视频观看在线www | 香蕉久久国产精品免| 国产精品视频一区二区三区四 | 69农夫和老妇重口小说| 帅哥我要补个胎小说| 久久精品国产只有精品2020| 毛片在线看免费版| 午夜不卡av免费| 靠逼软件app| 国产精品久久久久久 | 中文字幕人成乱码熟女| 日韩福利在线视频|