我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 语义 >

以语义网实现法律信息开放

归档日期:06-24       文本归类:语义      文章编辑:爱尚语录

  新科技与法律的研究正在国内引起越来越多的关注。大数据到底有多重要?算法问责在何种程度上能够实现?人工智能对法律实践和法学研究究竟有何影响?这些至关重要的的问题不仅是中国学界关心的事,也是世界各国同行努力研究的关键所在。智道栏目本着“他山之石,可以攻玉”的精神,将从下期起连续三期刊登对这些领域里在国际上影响重大的几位学者的访谈,并在今后陆续推出更多此类文章,以飨读者。

  恩里科·弗朗西斯科尼是意大利国家研究委员会法律信息研究所研究员、佛罗伦萨大学计算机科学学院教授,目前就职于欧盟委员会出版办公室。他曾参与欧盟委员会框架计划、欧洲议会、欧盟出版办公室等多个项目,任意大利和欧盟“为立法建立XML和URI标准”工作组成员,主要研究法律领域的语义网技术(语义网的概念由万维网联盟的蒂姆·伯纳斯-李于1998年提出,是指一种智能网络,它通过给万维网上的文档添加能够被计算机理解的元数据,使整个互联网成为一个通用的信息交换介质)、本体和知识表示、法律起草、用于法律文档分类和知识提取的人工智能技术。

  前不久,恩里科·弗朗西斯科尼教授受邀出席在中南大学举办的“法律人工智能前沿问题国际学术研讨会”。会后,笔者对其进行了专访。

  黎娟(以下简称黎):您目前的研究主要关注的是将语义网应用于法律领域尤其是立法领域,使人们更容易获取海量信息,也更方便地从网络上搜索和检索法律信息。那么,语义网是怎样实现这些研究目标的呢?

  恩里科·弗朗西斯科尼(以下简称恩里科):首先,语义网原则可以自然地应用于特定领域(如法律领域)。实际上,法律信息,特别是法律文本,通常具有明确的结构和语义。其次,立法程序也是结构良好且界定明确的工作流程,其中涉及议会和公共行政部门的多个立法机构。再次,法律信息系统不仅要为用户提供高级搜索工具,而且要构建法律秩序、监测新规则给法律规制带来的影响、管理法律文本及其不同版本的存续周期。最后,相较于简易的法律文本,用户往往对访问某个具体的法律规范更感兴趣,他们希望了解不同规范之间的关系,以及用这些信息支持其进行法律推理。

  在所有这些应用领域中,语义网对法律信息管理等高级服务的发展贡献斐然。因为语义网为法律信息的语义限定提供了标准和工具,使得法律信息更易被访问和被获取,并支持自动法律推理。

  黎:考虑到法律文本(语言)的不确定性和模糊性,语义网应用中存在哪些障碍?

  一个问题是,如何有效地对法律知识进行建模,使自动推理能够通过再现法哲学的观点进行推理,包括规范之间的关系推理。

  另一个问题则是,如何根据特定知识模型(也称为语义网中的“本体”)处理实际数据和解释事实。换句话说,就是如何从数据或者电脑模型的角度提出某种观点,就好像过去法官和检察官所做的那样:审视以叙事为载体的案件事实或者真实情况,并根据相关的法律规则对它们进行阐释,最终作出某个法律决策。

  语义网中的知识模型可以为法律文本提供语义注释。这有助于消除法律概念的歧义,并且能为实现高级法律信息服务(如比较分析和多语言环境下的法律信息检索和推理)奠定良好的基础。

  恩里科:我的实践经验始于2000年年初,项目主要涉及公共管理领域。最初,我参与了意大利一个根据语义网原则在互联网上制定和公布法律的项目。这是一个极具开创性的项目,得到了意大利政府、议会和高等法院的支持。

  这个项目包括两个部分。一个部分建立了意大利立法资料搜索的门户网站,确立了持续标注法律文档的标准和法律文本表示XML标准。随后,这些标准成为官方公布的技术规范,并且被越来越多的公共管理机构和私营企业所采用。另一个部分在前一部分的基础上有所改进,它将为公民提供免费访问现行意大利法律规范的一系列完整服务。这一服务的特点在于它可以根据用户输入的不同搜索条件进行法律文本检索,以满足用户多样化的法律信息搜索需求,尤其是用户可以基于法律文本的概念和主题进行语义搜索。

  在此之后,我们在荷兰、丹麦、瑞士、奥地利和英国等地推动了以“开放信息”为主题的项目。通过项目协同,我们形成了一个能对法律信息学领域的“最佳实践”进行充分讨论和交流的组织,旨在将人工智能和语义网工具应用于法律知识构建。基于已有经验,我们于2006年向欧洲标准化委员会发起了一项倡议并为此举办了工作坊。在倡议中,我们讨论了如何界定法律措施的唯一标识符。目前,我们受欧盟委员会委托,准备将这一成果经验推广成为欧洲标准。

  恩里科:我们所建立起来的组织每年推出一个工作坊系列,参加工作坊的研究人员和公共行政部门分享他们各自根据语义网原则进行法律信息系统开发的“最佳实践”做法。

  尽管“自上向下”进路的研究成果与法律语义网之间存在一定的相关性,但相关行动者需要付诸全面协调和经济投入才能遵循拟定的标准。但是,这一举措几乎不能带来直接的好处。因此,一种新的“自下向上”的语义网实现进路应运而生。

  这一进路基于关联开放数据原则的指导方针,实质上推动了语义网“自下而上”的发展。为了实现数据开放,这一进路使用URI命名规范和RDF格式来描述可用的语义数据,挖掘可用的粒度文档标记。该进路的目标是,在可获得的互操性层面促进共享格式的数据公开,使语义信息丰富和互连成为一种数据消费利益驱动下的良性趋势。

  关联开放数据的方法已被成功验证,它也代表了语义网领域内法律信息管理的趋势。

  恩里科:通过机器学习或自然语言处理的技术,法律文本、案例中的自然语言可以转化为机器能够理解的语言。目前,自然语言转化已成功应用于脸部识别和一般性模式识别等领域。近期人们发现,这对法律信息的转化也很有效,因为法律信息是非常技术性和具体化的。

  实践证明,法律信息能够转化为机器可以理解和执行的规则。这样,在给定前提的条件下,机器有望为公民、公共管理部门、法院提出建议或提供决策支持。也许这样的系统在短期内还不能实现完全自主,但在法律纠纷中,它可以处理大部分繁重而琐碎的工作,而这些往往是法律工作者不得不做的。

  我认为中国可以发起一项类似于“最佳实践”的项目,并和欧洲国家分享经验。应用语义网方法处理法律信息的好处在于,它不仅可以保障法律的确定性和权利的有效性,提升政府的透明度,也便于用户根据不同的信息需求使用法律信息。

  一个典型的例子是,只要法律出版商根据语义网实现的最新原则(即关联开放数据)出版或发布法律信息,那么他们就可以通过重复利用这些法律信息来发展业务。因此,我认为法律领域中的语义网实现将是一个值得中国政府投资的应用领域。

  黎:您如何评价语义网研究的实践可能性?更进一步说,您对未来语义网研究的应用与可能性有什么期望呢?

  恩里科:事实上,我认为法律领域是最能优先应用人工智能的领域之一。一方面,法律由规则以及可解释事实所构成;另一方面,计算机恰恰就是一种能基于既定规则处理数据的机器,这些数据理包括法律事件和事实。因此,人工智能和法律的结合自然而且直接,二者可以相互支持,这一点在语义网领域表现更加明显。因为语义网标准是一种能够根据规则结构化法律信息的有效工具,而机器能更好地处理信息,通过从前提推出结论,进行经得起检验的法律推理。因此,用户能更容易地获得信息。

  机器人法官的发展可能代表了未来人工智能在法律领域中的应用(尽管实现这一梦想仍很遥远)。在这个方向上,一些初步的应用程序已经被成功开发和应用,例如,一些电子商务网站提供的在线纠纷争端解决等半自动化服务的应用程序。但是,它们仍是能够根据法律规则处理数据并为客户提供法律建议的人工智能工具。

  我认为法律是人工智能应用的一个非常有趣的领域,在不久的将来,我们会看到很多好的甚至颇具变革性的观点。

  恩里科:就未来而言,我认为,人工智能会拉近法律与人们之间的距离。通过构建可执行规则(即机器能处理的)系统,人工智能能满足用户特定的信息需求;法官和法院能更好地查明和解释具体纠纷;在“遵循先例”的普通法领域,机器可以为法官、律师,甚至是普通公民检索出相似的案例等。

本文链接:http://mangerdulion.com/yuyi/109.html