提取自[腾讯词向量](https://ai.tencent.com/ailab/nlp/zh/download.html) **Small (2,000,000)** **Large (12,287,936)** 删除掉不必要的条目以及单字条目,`Large `再逆序生成词频,再把`Small`从`Large `中交集出一份。 `Large `和`Small`都分割成1-5个字的和5个字以上的两份文件。 感觉这玩意跟搜狗输入法的有点...嗯...熟悉 -_-y 有个别条目没有删干净,含有@等符号,不过不影响... https://encrypt.lanzout.com/b06udvaxe 密码: 23fa