假设有如下的多条数据:
佛山市威尔康乳胶制品有限公司
爱奥乐医疗器械(深圳)有限公司
...
现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。
假设有如下的多条数据:
佛山市威尔康乳胶制品有限公司
爱奥乐医疗器械(深圳)有限公司
...
现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。
这属于命名实体识别(NER),如果你只是想应用而已,直接import jieba就行了。
如果是想具体学习原理,推荐论文NLP from scratch
4 回答968 阅读
1 回答730 阅读
1 回答698 阅读
1 回答692 阅读
1 回答585 阅读
1 回答528 阅读
643 阅读
这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下