【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
谢邀,已锁单 pro配置无敌香,原本预计的是基础版25万...
2025-06-27阅读全文 >>因为苹果自己定制了ARM指令集和UEFI启动 简单来说就是苹...
2025-06-27阅读全文 >>题主没有具体需求,我们先从这俩分析一下: 先看价格对比: M...
2025-06-27阅读全文 >>最近喜欢上了养鱼,从网上买了几条小鱼,大小都差不多的,养着养...
2025-06-27阅读全文 >>不开玩笑,确实是真的, 女性在30岁之前,自然受孕几率变化很...
2025-06-27阅读全文 >>