安爸-超级家庭

Chonky:一个完全基于神经网络的文本分块工具

安爸 发布于

Chonky:一个完全基于神经网络的文本分块工具。它能将文本智能分割成有意义的语义块,帮助你更高效地处理和理解长文本。亮点:

  1. 使用Transformer模型,精准分块;
  2. 支持RAG系统,拓展应用范围;
  3. 一行代码即可完成安装,简单易用。

参考文献:
[1] https://github.com/mirth/chonky
[2] https://huggingface.co/mirth/chonky\_distilbert\_base\_uncased\_1


(文:NLP工程化)

Chonky:一个完全基于神经网络的文本分块工具最先出现在每时AI


扫描二维码,在手机上阅读