KConnect : 健康資訊的專業搜索引擎
(朱玉芬攝)
【臺灣癌症博物館 芝麻開門】
我們看到有一群非商業性的醫學人士,結合了尖端的數位工程師,在健康資訊上為大家把關,並且已經努力了20年,但是大多數人在健康諮詢的數位運用上,仍然只知仰賴商業性搜尋引如google,而對他們的貢獻仍然毫無所知。臺灣癌症博物館的「癌症知識庫」建立正在眼前,我們希望能向這些提供KConnect服務的先行者看齊,也在大家搜尋癌症知識上,做到Do no harm,不誤導大家去閱讀不可靠的健康資訊。
文 / 鄭春鴻 (文教部主任)
HON使用專為健康資訊提供搜尋的KConnect
HON致力於「促進全球醫療保健中遠程醫療新技術的有效和可靠使用」,在過去二十年中,發現了兩個主要挑戰:1. 如何辨別可靠的健康內容 ;2. 如何提供對可靠資源的訪問。為了達到精準的醫療主題搜尋及內容,HON使用的是與商業區隔,專為健康資訊提供搜尋的KConnect健康搜索引擎。
KConnect搜索是一種搜索可信賴的健康在線健康資訊的新方法。它是在2010年至 2017 年期間在歐盟項目中開發出來的。KConnect Search專門提供根據事實上的世界標準在線健康資訊手動檢查的在線健康資源的策劃列表。其使命是促進網站用戶獲取高質量的健康資訊,並經由這種方式達成資訊和健康的權利。
Medline每年有超過100萬篇論文被引用
簡言之,KConnect是一家適用於醫療保健提供商; 一種搜索醫療資訊的新方法;KConnect提供全新的智能搜索服務,使服務提供商能夠更快速,更輕鬆地查找(和消費)他們在日常工作中所需的相關資訊。
自2011年以來,Medline每年都有超過100萬篇論文被引用。研究人員越來越難以及時了解其領域或相關領域的所有發展。KConnect提供軟件工具,以提供最先進的醫學文本分析和搜索。這個工具可以更容易地找到最相關的文章,包括在系統評價中,能夠以母語搜索外國文本並以英語使用,同時能夠從多篇文章中提取資訊進行分析。KConnect的工具由12億個醫學文獻的知識庫支持。
基於該知識庫可以執行對醫療文檔的強大語義搜索,從而使系統知道搜索項的可能上下文,因此可以檢索更多數量的相關文檔。研究人員還能夠定義和構建自己的醫學文本處理流水線,以組合來自多個來源(包括組織中存儲的任何文本)的文本。在提取所需的搜索結果之前,對管道內的內容進行處理和半自動分析。
更廣泛的資訊,點擊次數更少
許多類型的醫療文件變得更長。臨床研究報告(CSR)現在通常是超過100頁的大型文件,而為方便與同行評審的期刊文章相比,改寫成更精簡的臨床研究記錄。這樣的簡要期刊文章通常只有6-10頁,這意味著許多重要的細節可能會被遺漏,例如潛在的危險不良事件。KConnect可以提供半自動分析,允許在幾分鐘內分析數百個CSR頁面,而不是手動進行數十小時的分析。
KConnect服務可以從一個接入點為臨床醫師提供各種醫療資訊源。例如電子醫療保健記錄(EHR),已發表的醫學文獻等。這意味著臨床醫師不再需要面對資訊孤島或進行大量的搜尋,密碼和不同資訊網站的入口,而只需要能夠進站直接搜尋,需要的醫學資訊變得更容易找到。
臨床醫師可以更有效地找到自己問題的解答,這意味著更好的病人照顧。在一個系統中臨床醫師可以找到關於病人的資訊並立即根據新的問診結果或病人的最新病情進一步第搜詢,例如以找到最新的臨床試驗,治療指南或研究文章。這不僅可以節省臨床醫師的時間,還可以為他們提供最新,最好的資訊,以便做出明智的決策,從而提高病人的護理質量和安全性。
語義智慧型讀取、多語言資源進行母語搜索
KConnect服務可以更好地理解和匹配用戶查詢和目標醫療資訊,從而產生更相關的結果。通過使用自然語言處理/文本分析中的最新技術(例如,自然實體識別,詞性標註等)以及在用戶製作之前自動準備醫學文本,使得醫學文本的改進的「機器閱讀」成為可能。搜索查詢。這包括自動分類和「標記」(語義標註),它引用概念以及它們與醫學知識庫中其他相關概念的關係。
然後,當用戶構造查詢時,使用相同的知識庫來識別概念(相關概念及其關係),從而減少查詢歧義並改善查詢上下文。搜索服務的這種智能提供了搜索性能的質量。它確保護理提供者始終能夠獲得有關最佳實踐和治療的正確知識。
如此一來,一個更健康的社區和最好的病人結果。Kconnect提供用戶以母語搜索資源,並以英語獲取任何外國醫學文本的結果。這再次增加了可能獲得的醫學知識的範圍。它通過KConnect對關鍵醫學概念的準確語言映射和高度發達的自動機器翻譯來實現。
Kconnect團隊陣容一時之選
Kconnect團隊是一群研究人員,包括商業搜索專家和健康組織的從業者。該團隊由以下人員組成:軟體技術與交互系統研究所負責協調KConnect項目,並提供有關特定領域搜索和搜索日誌分析的專業知識。Kconnect團隊包括Findwise AB。Findwise是一家不斷發展且屢獲殊榮的IT諮詢公司,員工遍布瑞典,丹麥,挪威和波蘭。Findwise由企業搜索行業的專家團隊於2005年創建,為網路,電子商務和應用程序創建了搜索驅動的可查找性解決方案。獨立專家,擁有領先搜索技術平台的知識和經驗;謝菲爾德大學是世界排名前100的大學,在英國的研究中排名前10%。對於KConnect,我們使用GATE將語義引入文本,GATE是用於自然語言處理和語言工程的最廣泛使用的開源工具包;Qulturum是一個學習和創新醫療保健臨床和工作流程的中心。Qulturum參與了地方,區域,國家和國際層面的幾個項目。重點是支持和促進系統重新設計和過程改進; 確保學習,建設能力,為員工和領導者提供支持,幫助他們改變護理流程並傳播良好的榜樣。Qulturum發起並領導各個層面的大規模變革,學習計劃,突破系列,會議,會議和諮詢支持,以制定改進,評估和研究方法;Precognox是匈牙利一家專門從事基於語言的智能搜索,文本挖掘和大數據解決方案的Java商店;Ontotext AD是一家提供文本分析和數據管理產品和服務的資訊管理公司。他們擁有最先進的語義技術,所有語義技術均在經批准的關聯數據標準下運行。
在醫學相關團隊上,Kconnect團隊包括倫敦國王學院,該校是倫敦精神病學,心理學和神經科學研究所是世界上最大的專門研究心理健康和神經退行性疾病的研究機構之一。關於KConnect,基於從超過250,000名精神衛生服務用戶的電子記錄中獲得的獨特的大型和高密度CRIS數據資源,在精神衛生臨床資訊學領域具有特殊優勢;捷克布拉格的查理大學通過形式和應用語言學研究所參與,並提供醫學領域機器翻譯技術。
從知識庫中提供疾病的大量資訊
KConnect語義標註服務可以自動查找病歷,醫學文獻和其他健康資訊文本中的疾病,解剖學,調查和藥物,並相應地進行註釋。語義註釋在文本中找到單詞的含義,並在KConnect知識庫中將它們與概念和想法(即語義)連結(即註釋)。這意味著,例如,它將區分感染「冷」和溫度「冷」。它還意味著當它在文本中找到某些東西時,例如疾病,它可以從知識庫中為您提供有關該疾病的大量資訊。
醫學語義搜索,智能讀取搜索查詢的含義和上下文
語義搜索通過理解用戶查詢的含義/上下文/意圖來提高準確性和相關性。使用語義搜索的查詢不僅基於關鍵字找到相關文本,還基於相關概念和上下文。查詢中的關鍵字可以具有內容和/或相關概念,其可能不一定在文檔或文本中是明確的。搜索通過用戶查詢的「機器理解」,背景和意圖以及您的醫療資訊資源的機器閱讀(文本分析,語義註釋和分類)來實現。這包括使用自動查詢建議。由此產生的詞義查詢識別(以及減少的曖昧關係)可以提供更好的搜索結果和更快,更相關的知識傳播,用戶可以從中實現可操作的見解並做出更明智的決策。
KConnect可以使用標準醫學術語統一標記(註釋)和分類所有數據/資訊 - 以及用戶擁有或想要開發的任何特定分類,本體或規則集。語義註釋和文檔分類都得到了不斷增長的超過12億RDF語句的醫學知識庫的支持。
語義標註的好處有:使用世界領先的GATE自然語言處理技術來幫助您將文本與知識聯繫起來;語義標註可以讓您在產品中進行智能搜索;文本的自動標註可以提高機器讀取速度,並可以更好地精確定位文本內;可提供英語,瑞典語,匈牙利語,法語;我們的工具包將幫助您適應其他語言的服務; Mimir搜索引擎專為文本和知識搜索組合而設計。
CloudMarket平台:醫療數據和文本分析及
KConnect CloudMarket是一個雲端上的低成本、按需生物醫學文本分析和數據管理提供一系列服務。包括:文本分析服務、大型知識圖有效選擇、雲端上的機器翻譯、完全管理的語義搜索。它為用戶帶來的主要好處有:按需訪問雲端中的文本挖掘和連接的開放數據技術、提高可用動,可擴展,低成本、服務使用免費。
KConnect提供多語言搜索和各種語言的醫學文本訪問。跨語言和語義搜索的能力為我們提供了市場上最好的醫療搜索服務。快速準確的在線翻譯服務;專門針對醫學和健康相關文本進行翻譯;針對完整句子進行優化並對搜索查詢進行排序;我們的語義註釋和本體也跨語言映射;支持語言:英語< - >捷克語,法語,德語,匈牙利語,波蘭語,西班牙語,瑞典語。
使用戶的搜索系統能夠處理各種語言的查詢;可以通過以英語顯示以前僅以其他外語發布的文檔來增加英語用戶的相關材料範圍;用戶可以用他們的首選語言制定查詢,並將搜索結果翻譯回他們的語言(來自英文文本)。
提供最佳的內容和文檔分類
KConnect可以通過使用標準(和翻譯)醫學術語,我們的醫學特定語義標註和索引服務,提供最佳的內容和文檔分類。分類越來越重要,特別是在期刊,文章,新出版商和新出版模式大幅增長的醫學領域。隨著越來越多的冗長的臨床試驗報告,即使是最專業的醫療專業人員和利基領域的研究人員也難以跟踪新的研究和開發。我們的分類和語義搜索不僅允許用戶在最廣泛的知識庫中居住,而且還可以用他們自己的語言訪問(搜索)。
KConnect的服務可以擴展到允許不同可讀性(讀寫能力)和用戶知識水平(基於查詢輸入和歷史日誌分析)的分類。創建這種準確的多語言和語義搜索服務所涉及的資源很多,包括:來自KConnect知識庫的術語和語言資源; 自然語言處理(NLP,例如命名實體識別); 語言特定的詞彙 - 句法工具(例如PoS,複合詞分裂); 高級語言組件(例如否定檢測,日期參考歸屬)和機器翻譯培訓醫學語料庫。這種分類也用於搜索結果的呈現,並且可以用於某些用例。
KConnect搜索日誌分析
隨著時間的推移,用戶與語義搜索服務的交互分析使我們能夠深入了解專業人士和普通公民搜索醫療資訊的內容和方式。通過機器學習和「智能規則」的建立,KConnect的服務可以不斷改進,從搜索日誌分析中學習可以大大增加使用者的特定搜索系統的可用性和用戶體驗。使用者還可以通過添加更多術語資源,本體開發和跨語言搜索日誌分析工具包來改進使用者的搜索系統。
從以上的說明,我們看到有一群非商業性的醫學人士,結合了尖端的數位工程師,在健康資訊上為大家把關,並且已經努力了20年,但是大多數人在健康諮詢的數位運用上,仍然只知仰賴商業性搜尋引如google,而對他們的貢獻仍然毫無所知。臺灣癌症博物館的「癌症知識庫」建立正在眼前,我們希望能向這些提供KConnect服務的先行者看齊,也在大家搜尋癌症知識上,做到Do no harm,不誤導大家去閱讀不可靠的健康資訊。