Stars
Python scripts for training/testing paragraph vectors
这是一个类,里面包含的有关文本相似度的常用的计算算法,例如,最长公共子序列,最短标记距离,TF-IDF等算法
Easily generate document/paragraph/sentence vectors and calculate similarity.
GitHub最全的前端资源汇总仓库(包括前端学习、开发资源、求职面试等)
HIT-SCIR / pyltp
Forked from HuangFJ/pyltppyltp: the python extension for LTP
根据自己搭的 LTP 服务器,实现:分词、词性标注、命名实体识别、依存句法分析、语义角色标、命名实体的抽取:人名,地名,机构名、三元组的抽取:主谓宾,动宾关系,介宾关系,(实体1,关系,实体2)
An optimizer that trains as fast as Adam and as good as SGD.
一个用于提取简体中文字符串中省,市和区并能够进行映射,检验和简单绘图的python模块
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
Python library for information extraction of quantities from unstructured text
Chinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT 中文实体识别与关系提取
A topic-centric list of HQ open datasets.
史上最大规模1.4亿知识图谱数据免费下载,知识图谱,通用知识图谱,融合了两千五百多万的实体,拥有亿级别的实体属性关系。
all kinds of text classification models and more with deep learning
Doc2Vec algorithm for solving moview review sentiment analysis
A natural language modeling framework based on PyTorch
StyleGAN - Official TensorFlow Implementation
利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp
Software in C and data files for the popular GloVe model for distributed word representations, a.k.a. word vectors or embeddings
Code for the paper "Language Models are Unsupervised Multitask Learners"