Skip to content

机构名识别错误 #407

Closed
Closed
@Himan000

Description

@Himan000

您好!请教一个HanLP分词的问题。"为广大运维者所喜爱",对于这句话的“所”,应该是被动的意思,"运维者所"被识别成了机构名。请教下这个东西怎么优化好?
补充:这里HanLP经过核心词典和用户词典初分词后,分成了运维/者/所三个词,但是在机构名识别的过程中,机构名标注是不怎么管初分词性和前后语义关系的,只要符合机构名的模式匹配,就会不管三七二十一归为机构名。本人通过源代码理解这里是一个缺陷,不知道有没有理解错误。如果没有理解错误,有没有什么好的解决办法,因为无论是人名、地名、机构名识别都好,都是类似的缺陷,对一些文本尤其是特定领域的文本识别准确率是很低的。望赐教,谢谢!

Metadata

Metadata

Assignees

No one assigned

    Labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions