博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ZH奶酪:自然语言处理工具LTP语言云调用方法
阅读量:6532 次
发布时间:2019-06-24

本文共 3331 字,大约阅读时间需要 11 分钟。

前言

LTP语言云平台

      不支持离线调用;

  支持分词、词性标注、命名实体识别、依存句法分析、语义角色标注

  不支持自定义词表,但是你可以先用其他支持自定义分词的工具(例如)把文本进行分词,再让ltp帮你标注

     支持C#、Go、Java、JavaScript、Nodejs、PHP、Python、R、Ruby等语言调用;  

     还有一些、、(这几个我至今也没用到);

正文

官方网址:

使用文档:

在线演示:

各种语言调用实例可以到Github上下载:

例如Python版本的:

Step1:注册

在申请一个API key,稍后会用到;

Step2:一个简单的例子(Python版)

(1)复制代码:从Github上复制一段代码(取决于你使用的语言和所需的功能)

(2)修改代码:

  <1>把 api_key = "YourApiKey" 中的 "YourApiKey" 修改成你Step1申请的API Key;

  <2>把 text = "我爱北京天安门" 修改成你要处理的文本;

  <3>根据需求设置不同的参数(其实只需要api_key,text,pattern,format四个参数就够了,仔细看下pattern):

   

# -*- coding: utf-8 -*-#!/usr/bin/env python# This example shows how to use Python to access the LTP API to perform full# stack Chinese text analysis including word segmentation, POS tagging, dep-# endency parsing, name entity recognization and semantic role labeling and# get the result in specified format.import urllib2, urllibimport sysif __name__ == '__main__':    if len(sys.argv) < 2 or sys.argv[1] not in ["xml", "json", "conll"]:        print >> sys.stderr, "usage: %s [xml/json/conll]" % sys.argv[0]        sys.exit(1)    uri_base = "http://ltpapi.voicecloud.cn/analysis/?"    api_key  = "YourApiKey"    text     = "我爱北京天安门"    # Note that if your text contain special characters such as linefeed or '&',    # you need to use urlencode to encode your data    text     = urllib.quote(text)    format   = sys.argv[1]    pattern  = "all"    url      = (uri_base               + "api_key=" + api_key + "&"               + "text="    + text    + "&"               + "format="  + format  + "&"               + "pattern=" + "all")    try:        response = urllib2.urlopen(url)        content  = response.read().strip()        print content    except urllib2.HTTPError, e:        print >> sys.stderr, e.reason

Step3:运行

如果要批量处理txt或者xml文件,需要自己写一段批量处理的代码,下边是我之前项目中用到的一段批量处理某一目录下txt文件代码(就是加了一层循环和设置了一个输出):

1 # -*- coding: utf-8 -*- 2 #!/usr/bin/env python 3  4 # This example shows how to use Python to access the LTP API to perform full 5 # stack Chinese text analysis including word segmentation, POS tagging, dep- 6 # endency parsing, name entity recognization and semantic role labeling and 7 # get the result in specified format. 8  9 import urllib2, urllib10 import sys11 12 if __name__ == '__main__':13     uri_base = "http://ltpapi.voicecloud.cn/analysis/?"14     api_key  = "7132G4z1HE3S********DSxtNcmA1jScSE5XumAI"15 16     f = open("E:\\PyProj\\Others\\rite_sentence.txt")17     fw = open("E:\\PyProj\\Others\\rite_pos.txt",'w')18 19     line = f.readline()20     while(line):21         text     = line22         # Note that if your text contain special characters such as linefeed or '&',23         # you need to use urlencode to encode your data24         text     = urllib.quote(text)25         format   = "plain"26         pattern  = "pos"27 28         url      = (uri_base29                    + "api_key=" + api_key + "&"30                    + "text="    + text    + "&"31                    + "format="  + format  + "&"32                    + "pattern=" + pattern)33 34         try:35             response = urllib2.urlopen(url)36             content  = response.read().strip()37             print content38             fw.write(line+content+'\n')39         except urllib2.HTTPError, e:40             print >> sys.stderr, e.reason41         line = f.readline()42     fw.close()43     f.close()

 

转载地址:http://cpqbo.baihongyu.com/

你可能感兴趣的文章
Chrome 更新策略大变:优先安装 64 位版本
查看>>
《Linux从入门到精通(第2版)》——导读
查看>>
路过下载攻击利用旧版 Android 漏洞安装勒索软件
查看>>
《ANTLR 4权威指南》——1.2 运行ANTLR并测试识别程序
查看>>
ThinkSNS 六大子版本体验及源码下载
查看>>
《算法基础》——1.5实际因素
查看>>
《Java数字图像处理:编程技巧与应用实践》——第3章 基本Swing UI组件与图像显示 3.1 JPanel组件与BufferedImage对象的显示...
查看>>
为什么有人讨厌 Google 的新 Logo?
查看>>
2022 年 AI 会发展成什么样子,IBM 做出了 5 大预测
查看>>
Python 修炼2
查看>>
eclipse新版注释文字太小
查看>>
18-python-文件的操作
查看>>
P3387 【模板】缩点 && P3388 【模板】割点(割顶)
查看>>
GPS
查看>>
sudo执行命令时环境变量被重置的解决方法
查看>>
线程同步------1.事件
查看>>
配置Struts2报错:
查看>>
Android UI学习前言:Android UI系统的知识结构
查看>>
众包测试正在改变游戏规则(转)
查看>>
libunistring-0.9.9
查看>>