KConnect : 健康资讯的专业搜索引擎
(朱玉芬摄)
【台湾癌症博物馆 芝麻开门】
我们看到有一群非商业性的医学人士,结合了尖端的数位工程师,在健康资讯上为大家把关,并且已经努力了20年,但是大多数人在健康谘询的数位运用上,仍然只知仰赖商业性搜寻引如google,而对他们的贡献仍然毫无所知。台湾癌症博物馆的「癌症知识库」建立正在眼前,我们希望能向这些提供KConnect服务的先行者看齐,也在大家搜寻癌症知识上,做到Do no harm,不误导大家去阅读不可靠的健康资讯。
文 / 郑春鸿 (文教部主任)
HON使用专为健康资讯提供搜寻的KConnect
HON致力於「促进全球医疗保健中远程医疗新技术的有效和可靠使用」,在过去二十年中,发现了两个主要挑战:1. 如何辨别可靠的健康内容 ;2. 如何提供对可靠资源的访问。为了达到精准的医疗主题搜寻及内容,HON使用的是与商业区隔,专为健康资讯提供搜寻的KConnect健康搜索引擎。
KConnect搜索是一种搜索可信赖的健康在线健康资讯的新方法。它是在2010年至 2017 年期间在欧盟项目中开发出来的。KConnect Search专门提供根据事实上的世界标准在线健康资讯手动检查的在线健康资源的策划列表。其使命是促进网站用户获取高质量的健康资讯,并经由这种方式达成资讯和健康的权利。
Medline每年有超过100万篇论文被引用
简言之,KConnect是一家适用於医疗保健提供商; 一种搜索医疗资讯的新方法;KConnect提供全新的智能搜索服务,使服务提供商能够更快速,更轻松地查找(和消费)他们在日常工作中所需的相关资讯。
自2011年以来,Medline每年都有超过100万篇论文被引用。研究人员越来越难以及时了解其领域或相关领域的所有发展。KConnect提供软件工具,以提供最先进的医学文本分析和搜索。这个工具可以更容易地找到最相关的文章,包括在系统评价中,能够以母语搜索外国文本并以英语使用,同时能够从多篇文章中提取资讯进行分析。KConnect的工具由12亿个医学文献的知识库支持。
基於该知识库可以执行对医疗文档的强大语义搜索,从而使系统知道搜索项的可能上下文,因此可以检索更多数量的相关文档。研究人员还能够定义和构建自己的医学文本处理流水线,以组合来自多个来源(包括组织中存储的任何文本)的文本。在提取所需的搜索结果之前,对管道内的内容进行处理和半自动分析。
更广泛的资讯,点击次数更少
许多类型的医疗文件变得更长。临床研究报告(CSR)现在通常是超过100页的大型文件,而为方便与同行评审的期刊文章相比,改写成更精简的临床研究记录。这样的简要期刊文章通常只有6-10页,这意味着许多重要的细节可能会被遗漏,例如潜在的危险不良事件。KConnect可以提供半自动分析,允许在几分钟内分析数百个CSR页面,而不是手动进行数十小时的分析。
KConnect服务可以从一个接入点为临床医师提供各种医疗资讯源。例如电子医疗保健记录(EHR),已发表的医学文献等。这意味着临床医师不再需要面对资讯孤岛或进行大量的搜寻,密码和不同资讯网站的入口,而只需要能够进站直接搜寻,需要的医学资讯变得更容易找到。
临床医师可以更有效地找到自己问题的解答,这意味着更好的病人照顾。在一个系统中临床医师可以找到关於病人的资讯并立即根据新的问诊结果或病人的最新病情进一步第搜询,例如以找到最新的临床试验,治疗指南或研究文章。这不仅可以节省临床医师的时间,还可以为他们提供最新,最好的资讯,以便做出明智的决策,从而提高病人的护理质量和安全性。
语义智慧型读取、多语言资源进行母语搜索
KConnect服务可以更好地理解和匹配用户查询和目标医疗资讯,从而产生更相关的结果。通过使用自然语言处理/文本分析中的最新技术(例如,自然实体识别,词性标注等)以及在用户制作之前自动准备医学文本,使得医学文本的改进的「机器阅读」成为可能。搜索查询。这包括自动分类和「标记」(语义标注),它引用概念以及它们与医学知识库中其他相关概念的关系。
然後,当用户构造查询时,使用相同的知识库来识别概念(相关概念及其关系),从而减少查询歧义并改善查询上下文。搜索服务的这种智能提供了搜索性能的质量。它确保护理提供者始终能够获得有关最佳实践和治疗的正确知识。
如此一来,一个更健康的社区和最好的病人结果。Kconnect提供用户以母语搜索资源,并以英语获取任何外国医学文本的结果。这再次增加了可能获得的医学知识的范围。它通过KConnect对关键医学概念的准确语言映射和高度发达的自动机器翻译来实现。
Kconnect团队阵容一时之选
Kconnect团队是一群研究人员,包括商业搜索专家和健康组织的从业者。该团队由以下人员组成:软体技术与交互系统研究所负责协调KConnect项目,并提供有关特定领域搜索和搜索日志分析的专业知识。Kconnect团队包括Findwise AB。Findwise是一家不断发展且屡获殊荣的IT谘询公司,员工遍布瑞典,丹麦,挪威和波兰。Findwise由企业搜索行业的专家团队於2005年创建,为网路,电子商务和应用程序创建了搜索驱动的可查找性解决方案。独立专家,拥有领先搜索技术平台的知识和经验;谢菲尔德大学是世界排名前100的大学,在英国的研究中排名前10%。对於KConnect,我们使用GATE将语义引入文本,GATE是用於自然语言处理和语言工程的最广泛使用的开源工具包;Qulturum是一个学习和创新医疗保健临床和工作流程的中心。Qulturum参与了地方,区域,国家和国际层面的几个项目。重点是支持和促进系统重新设计和过程改进; 确保学习,建设能力,为员工和领导者提供支持,帮助他们改变护理流程并传播良好的榜样。Qulturum发起并领导各个层面的大规模变革,学习计划,突破系列,会议,会议和谘询支持,以制定改进,评估和研究方法;Precognox是匈牙利一家专门从事基於语言的智能搜索,文本挖掘和大数据解决方案的Java商店;Ontotext AD是一家提供文本分析和数据管理产品和服务的资讯管理公司。他们拥有最先进的语义技术,所有语义技术均在经批准的关联数据标准下运行。
在医学相关团队上,Kconnect团队包括伦敦国王学院,该校是伦敦精神病学,心理学和神经科学研究所是世界上最大的专门研究心理健康和神经退行性疾病的研究机构之一。关於KConnect,基於从超过250,000名精神卫生服务用户的电子记录中获得的独特的大型和高密度CRIS数据资源,在精神卫生临床资讯学领域具有特殊优势;捷克布拉格的查理大学通过形式和应用语言学研究所参与,并提供医学领域机器翻译技术。
从知识库中提供疾病的大量资讯
KConnect语义标注服务可以自动查找病历,医学文献和其他健康资讯文本中的疾病,解剖学,调查和药物,并相应地进行注释。语义注释在文本中找到单词的含义,并在KConnect知识库中将它们与概念和想法(即语义)连结(即注释)。这意味着,例如,它将区分感染「冷」和温度「冷」。它还意味着当它在文本中找到某些东西时,例如疾病,它可以从知识库中为您提供有关该疾病的大量资讯。
医学语义搜索,智能读取搜索查询的含义和上下文
语义搜索通过理解用户查询的含义/上下文/意图来提高准确性和相关性。使用语义搜索的查询不仅基於关键字找到相关文本,还基於相关概念和上下文。查询中的关键字可以具有内容和/或相关概念,其可能不一定在文档或文本中是明确的。搜索通过用户查询的「机器理解」,背景和意图以及您的医疗资讯资源的机器阅读(文本分析,语义注释和分类)来实现。这包括使用自动查询建议。由此产生的词义查询识别(以及减少的暧昧关系)可以提供更好的搜索结果和更快,更相关的知识传播,用户可以从中实现可操作的见解并做出更明智的决策。
KConnect可以使用标准医学术语统一标记(注释)和分类所有数据/资讯 - 以及用户拥有或想要开发的任何特定分类,本体或规则集。语义注释和文档分类都得到了不断增长的超过12亿RDF语句的医学知识库的支持。
语义标注的好处有:使用世界领先的GATE自然语言处理技术来帮助您将文本与知识联系起来;语义标注可以让您在产品中进行智能搜索;文本的自动标注可以提高机器读取速度,并可以更好地精确定位文本内;可提供英语,瑞典语,匈牙利语,法语;我们的工具包将帮助您适应其他语言的服务; Mimir搜索引擎专为文本和知识搜索组合而设计。
CloudMarket平台:医疗数据和文本分析及
KConnect CloudMarket是一个云端上的低成本、按需生物医学文本分析和数据管理提供一系列服务。包括:文本分析服务、大型知识图有效选择、云端上的机器翻译、完全管理的语义搜索。它为用户带来的主要好处有:按需访问云端中的文本挖掘和连接的开放数据技术、提高可用动,可扩展,低成本、服务使用免费。
KConnect提供多语言搜索和各种语言的医学文本访问。跨语言和语义搜索的能力为我们提供了市场上最好的医疗搜索服务。快速准确的在线翻译服务;专门针对医学和健康相关文本进行翻译;针对完整句子进行优化并对搜索查询进行排序;我们的语义注释和本体也跨语言映射;支持语言:英语< - >捷克语,法语,德语,匈牙利语,波兰语,西班牙语,瑞典语。
使用户的搜索系统能够处理各种语言的查询;可以通过以英语显示以前仅以其他外语发布的文档来增加英语用户的相关材料范围;用户可以用他们的首选语言制定查询,并将搜索结果翻译回他们的语言(来自英文文本)。
提供最佳的内容和文档分类
KConnect可以通过使用标准(和翻译)医学术语,我们的医学特定语义标注和索引服务,提供最佳的内容和文档分类。分类越来越重要,特别是在期刊,文章,新出版商和新出版模式大幅增长的医学领域。随着越来越多的冗长的临床试验报告,即使是最专业的医疗专业人员和利基领域的研究人员也难以跟踪新的研究和开发。我们的分类和语义搜索不仅允许用户在最广泛的知识库中居住,而且还可以用他们自己的语言访问(搜索)。
KConnect的服务可以扩展到允许不同可读性(读写能力)和用户知识水平(基於查询输入和历史日志分析)的分类。创建这种准确的多语言和语义搜索服务所涉及的资源很多,包括:来自KConnect知识库的术语和语言资源; 自然语言处理(NLP,例如命名实体识别); 语言特定的词汇 - 句法工具(例如PoS,复合词分裂); 高级语言组件(例如否定检测,日期参考归属)和机器翻译培训医学语料库。这种分类也用於搜索结果的呈现,并且可以用於某些用例。
KConnect搜索日志分析
随着时间的推移,用户与语义搜索服务的交互分析使我们能够深入了解专业人士和普通公民搜索医疗资讯的内容和方式。通过机器学习和「智能规则」的建立,KConnect的服务可以不断改进,从搜索日志分析中学习可以大大增加使用者的特定搜索系统的可用性和用户体验。使用者还可以通过添加更多术语资源,本体开发和跨语言搜索日志分析工具包来改进使用者的搜索系统。
从以上的说明,我们看到有一群非商业性的医学人士,结合了尖端的数位工程师,在健康资讯上为大家把关,并且已经努力了20年,但是大多数人在健康谘询的数位运用上,仍然只知仰赖商业性搜寻引如google,而对他们的贡献仍然毫无所知。台湾癌症博物馆的「癌症知识库」建立正在眼前,我们希望能向这些提供KConnect服务的先行者看齐,也在大家搜寻癌症知识上,做到Do no harm,不误导大家去阅读不可靠的健康资讯。