Repustate向世界各地的企业和组织提供文本分析服务。随着公司的发展,他们每天处理的文本段数量从5亿增加到10亿。大规模的文本分析非常困难,因为很少会出现两段文本完全相同的情况,所以无法利用缓存。不过,它可以将大段的文本分成多个句子,然后并发分析每个句子。近日,Repustate官方博客发表了一篇博文,介绍其API从Django到Python、再到Go的演进过程。
By 谢丽
Repustate向世界各地的企业和组织提供文本分析服务。随着公司的发展,他们每天处理的文本段数量从5亿增加到10亿。大规模的文本分析非常困难,因为很少会出现两段文本完全相同的情况,所以无法利用缓存。不过,它可以将大段的文本分成多个句子,然后并发分析每个句子。近日,Repustate官方博客发表了一篇博文,介绍其API从Django到Python、再到Go的演进过程。
By 谢丽