"); //-->
一、丁香園業務場景概述
丁香園起點是打造一個專業的醫學學術論壇,為醫生、醫學生、醫療從業者等提供一個信息交流的平臺。丁香園的主要用戶是醫療從業人員,會在論壇上發布考博、規培分數線、求助醫療文獻等內容。隨著業務的不斷擴展,發展出了丁香醫生、丁香媽媽等APP,為大眾用戶提供了一個健康信息平臺。
目前丁香園從早期的醫生用戶擴展到了大眾用戶,實現了ToD(To Dcotor),ToC雙核心驅動,業務會覆蓋這兩類人群的日常需求。比如,對醫生為主的醫療從業者來說,會涉及到日常的學術問題、經驗分享、疑難病例的討論以及查閱****品說明書、診療指南等。對大眾用戶來說,包括線上問診、科普知識、健康商城等服務。在2021年,丁香園C端規模達到1.2億,醫生端擁有全國70%的醫生作為注冊用戶。
二、醫療圖譜構建
首先介紹一下丁香園應用到的醫療健康圖譜。醫療健康圖譜構建由專業的醫療團隊來維護,有醫學背景相關同事維護疾病、癥狀、手術、****品等醫學概念以及60多種醫學關系。同時,丁香園nlp組會用一些算法去抽取和意圖分類等工作,利用算法與人工相結合的方式對實體、關系、實體屬性進行擴充。因為丁香園業務模式較多,需要考慮在圖譜應用上如何做遷移、融合工作。
為更好地去分析用戶意圖,構建用戶畫像,在實際工作中我們使用一種Taxonomy概念圖譜。例如,搜索十二指腸潰瘍,丁香醫生會給出一個搜索結果:“十二指腸潰瘍怎么去治療”,它是消化內科的一個疾病,可以將其定義為一個消化內科的概念。在丁香園搜索規培考試,給對應的規培考試內容標注相關的標簽,比如成績查詢、內科的標簽考試答案等。
概念圖譜會以一個四層結構構建:
第一層底層是entity實體層,例如規培考試、十二指腸潰瘍、腹痛等。
往上一層是instance層,也就是文章內容。例如十二指腸潰瘍怎么治療。
concept層是概念層,可以根據文章的用戶點擊行為、搜索行為、內容聚類,抽象到上層的concept概念結構,比如十二指腸潰瘍對應的是消化內科的一種疾病。
最上面一層,建立與業務強相關的topic層。
利用層級關系對長短文本進行多層次、豐富主題的刻畫,去分析、理解用戶的搜索行為。
之前提到了兩種知識圖譜的構建,接下來介紹如何使用算法去優化命名實體識別、關系抽取等。舉一個命名實體識別的例子,如“癥狀性動脈粥樣硬化性椎動脈起始部狹窄的治療”,常規NER可能會把這個識別成三個實體:
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
相關推薦
基于Microchip MCU的AI/ML培訓教程3
PowiGaN for AI Data Centers: Unmatched Power Density and Reliability
基于Microchip MCU的AI/ML培訓教程1
AI正在成為美國軍事系統核心
EEPW2018年3月刊(工業物聯網)
尼吉康的事業介紹
賦能AI與新能源時代的高動態MW級負載平臺
萬家樂JSYZ5-AI燃氣熱水器電路圖
基于Microchip MCU的AI/ML培訓教程2
盡管與亞馬遜達成芯片合作,英偉達股價仍下跌 3%,油價與加息擔憂沖擊 AI 交易
CSR8670CSR8675智能語音Alexa藍牙方案開發
iCAN-4017 AI功能模塊
EEPW2018年6月刊(5G)
海聯達(Aigale)Ai-HD1 無線全高清套件拆解
英偉達 Groq 3:AI 推理時代已至
在工業自動化和智能家用電器設計中實現支持邊緣 AI 的電機控制
WTC-AI型太陽能熱水器電路圖
Gartner發布三大AI價值實現路徑
邊緣 AI 加速的 Arm? Cortex??M0+ MCU 如何為電子產品注入更強智能
基于VisitionX制造智能眼鏡
瑞薩電子AI單元解決方案成功提高GE醫療(日本)日野工廠的生產力
芯片互連初創企業Kandou AI完成2.25億美元融資
繼上次海聯達Ai-ap100拆機之電源改造
WTC-AI太陽能熱水器電路圖
人工智能是如何幫助阻止造假者的?
電子元件培訓教材
TI 攜手 NVIDIA 推出面向下一代 AI 數據中心的完整 800 VDC 電源架構
AI狂潮 半導體通膨壓力重重
釋說芯語16:硬科技:構建企業未來之路(附PPT)
基于Ai-WB2-12F與Rd-04的雷達檢測系統