准备工作
必须安装的有
-jdk(10.0.1)
-Tomcat(9.0.8)
可选安装的有
-MySQL(CentOS7用的是Maria)
乾坤未定
1.安装命令很简单(网上有些很复杂,需要上官网下载等,诚然直接apt-get版本可能有点旧,但是简单啊)
2.library的安装(这个可以和平台无关)
文本挖掘:是指从大量的文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些识更好的组织信息以便将来参考。
搜索和信息检索(IR):存储和文本文档的检索,包括搜索引擎个关键字搜索
文本聚类:使用聚类方法,对词汇、片段、段落或文件进行分组和归类
文本分类:对片段、段落或文件进行分组和归类,在使用数据挖掘分类方法的基础上,经过训练的标记示例模型。
Web挖掘:在互联网上进行数据和文本的挖掘,并特别关注网络的规模和相互的联系。
信息抽取(IE):从非结构化文本中识别与提取有关的事实和关系:从非结构化或半结构化文本中抽取结构化数据的过程。
自然语言处理(NLP):将语言作为一种有意义、有规则的符号系统,从底层解析和理解语言的任务(例如词性的标注);目前的技术方法主要从语法、语义的角度发现语言最本质的结构和所表达的意义。
概念的提取:把单词和短语按语义分成意义相似的组
import cv2
import numpy as np
img = cv2.imread('demo.jpg')
conners = np.array([[873,1322],[1973,1864],[2645,3152],[857,2568]], dtype = "float32") #矩形(比如:书)的顶点 tl,tr,br,bl
canvas = np.array([[0,0],[500,0],[500,500],[0,500]], dtype = "float32") #输出文件的大小
M = cv2.getPerspectiveTransform(conners,canvas)
result = cv2.warpPerspective(img,M,(0,0))
cv2.imshow("img", result)
cv2.waitKey(0)