2020年3月11日,IBM 宣布推出几项全新的 IBM Watson 技术,旨在帮助组织机构更清晰地识别、理解和分析英语语言中某些最具挑战性的方面,从而获取更多洞察。
全新的 IBM Watson 技术代表着Project Debater 所提供的关键自然语言处理(Natural Language Processing,NLP)能力首次实现商业化,Project Debater 由IBM研究院(IBM Research)研发,是目前唯一一个能够就复杂话题与人类展开辩论的人工智能系统。在此次推出的技术中,IBM 首次界定了一项新型高级情绪分析能力,以识别及分析习惯用语和口语化表达。对于人工智能系统而言,识别诸如 hardly helpful(几乎没有帮助) 或 hot under the collar(怒气冲天) 之类的短语一直是一项挑战,因为它们难以被算法识别。通过高级情绪分析,企业可以使用 Watson 应用程序接口(API)来分析此类语言数据,从而更全面地了解自身运营情况。此外,IBM 还将 IBM 研究院的技术应用于理解诸如 PDF 文档和合同之类的商业文档,并将这些技术添加到 IBM 人工智能模型当中。
IBM Data and AI总经理 Rob Thomas 表示, 语言既是表达思想和观点的工具,也是传递信息的工具。正因如此,我们将Project Debater中获取的技术集成到Watson,我们相信 NLP 将增强企业从人类语言中采集、分析和理解信息的能力,这将有助于企业更好地利用蕴含在数据中的智慧资产。
IBM 宣布,计划将在全年致力于将 Project Debater 技术集成至 Watson,并侧重于提高客户使用自然语言的能力:
A. 分析-高级情绪分析(Advanced Sentiment Analysis)。IBM 增强了情绪分析能力,能够更好地识别和理解复杂的单词组合,比如像包含短语和表达的习惯用语以及所谓的情绪转换词组(sentiment shifter),即由不同单词组成但却呈现新含义的单词组合,例如 hardly helpful(几乎没有帮助) 。该技术将于本月整合至Watson Natural Language Understanding 。此外,我们还宣布了一项新的分类技术,借助该技术,客户将能创建人工智能模型,更轻松地分类采购合同等商业文档中出现的条款。利用Project Debater 中的基于深度学习的分类技术(deep learning-based classification technology),该新能力可从仅数百个示例中学习,进而快速、轻松地执行新分类。该技术计划将于今年晚些时候添加至 Watson Discovery。
B. 摘要提炼-总结(Summarization)。该技术可从各种来源中提取文本数据,为用户就与特定主题相关的口头和书面言论提炼一份摘要。今年的格莱美颁奖礼通过Summarization 的一个早期版本分析了超过 1,800 万篇文章、博客和个人档案,以提炼关于数百名格莱美艺术家和名人的细微洞察。随后,该数据被应用到 www.grammy.com 的红毯视频直播、点播视频以及照片中,帮助粉丝更深入地了解当晚主要话题的背景信息。该技术计划将于今年晚些时候被添加至 IBM Watson Natural Language Understanding 。
C. 聚类-高级主题聚类(Advanced Topic Clustering)。基于从 Project Debater 获得的洞察,全新主题聚类技术将支持用户对输入的数据进行 聚类 ,从而就相关信息创建有意义的 主题 ,用户随后即可对这些主题进行分析。这项计划将于今年晚些时候整合至 Watson Discovery 的技术,还将支持主题专家对主题进行定制和微调,以反映特定企业或行业的语言风格,例如保险、医疗健康和制造行业。
IBM 长期以来一直是 NLP 领域的领军者,致力于开发技术以支持计算机系统更准确、更快速地学习、分析及理解人类语言,包括感情色彩、方言、语调等等。IBM 已通过 Watson 将其 NLP 技术推向市场,其中大部分由 IBM 研究院研发,例如,用于文书理解的 Watson Discovery、用于虚拟代理的 IBM Watson Assistant以及用于高级情绪分析的Watson Natural Language Understanding。
ESPN Fantasy Football使用Watson Discovery和Watson Knowledge Studio分析赛季中每天产生的数以百万计的足球数据来源,以提供关于Fantasy Football运动员的数百万个实时洞察。通过自然语言处理,Watson可以识别包括新闻文章、博客、论坛、排名、预测、播客和推特等内容的语气和情绪,涵盖了从更衣室洞察到伤病分析等全方位的内容。ESPN Fantasy Football在球员卡中展示了这些洞见,这些球员卡记录了每个球员的升/降级(Boom/Bust)潜力,以及 球员的关键球能力(Player Buzz) 部分,它总结了有关一名球员的正面或负面评论。
四大会计师事务所之一的毕马威(KPMG),拥有遍布全球的专业服务网络,它与IBM合作创建了一个基于Watson多种服务的人工智能解决方案,包括Watson Natural Language Understanding等。该技术使企业能更有效地识别、申报和留存诸如潜在的研发所得税抵免。该解决方案由毕马威开发,Watson技术支持在最大限度减少对客户业务干扰的同时、快速审查更多文档,因此该方案可以帮助客户增加他们获得的研发所得税抵免。
过去一年,毕马威的客户看到了研发税收抵免的更多可能性,一些项目的审查文件数量甚至增加了1000%以上。该解决方案在减少对业务干扰的同时,能帮助客户发现更多有资格获得额外所得税抵免的潜在活动。因此,可以通过减少工程师和科学家用于所得税合规活动的时间,让他们更专注于创新的研发工作。