您可以创建语言资源,如字典和规则,包括在你的UIMA的管道分析文本和感兴趣的项目中,如姓名的城市。
大多数语言资源的源数据存储在数据库中。每个数据库是建立在编译文件中可以使用UIMA管道分析文本和感兴趣的项目注释。每当更新资源时,必须在数据库使用更新的资源分析文档之前,从数据库中重新编译其已编译的文件。
您可以通过导出数据库备份数据库。如果需要,可以从导出的数据库内容创建数据库,例如将数据库复制到另一台计算机。
Tip
Before you can perform the following operations on a dictionary or rules database, you must close the database by right-clicking the database in the Studio Explorer view and clicking Close.
- Synchronize a database with a source control repository
- Copy a database
- Edit properties of a database
- Import data into a database
词典
内容分析工作室使用多种类型的词典标识文本中的词汇并获取词汇的相关信息。
配置分割规则
配置分割规则词典,可以指示内容分析工作室如何标识文档中的文本。
字符规则
字符规则用于标识文本中特殊的实体,如电话号码、email地址、产品标识等。
解析规则
解析规则标识了文本模式,用于展示我们关心的特殊概念,例如人的名字、公司收购信息等。比如,可以创建标识IBM收购Lotus开发部门的规则。