项目简介 该 OCR 系统专门设计用于从复杂的教育材料(如试卷)中提取结构化数据,以优化机器学习(ML)训练的格式。它支持多语言文本、数学公式、表格、图表和图表,非常适合创建高质量的训练数据集。 关键特性 – 优化用于机器学习训练:提取的元素,如图表、表格和图形,都附有语义注释和上下文解释。这包括为视觉内容自动生成自然语言描述(例如,“此图显示了有丝分裂的...
最近ChatGPT 4o和Germini都推出了出图、P图等功能,给comfyUI带来了很大的压力。 不过,在很多人认为工作流模式就要消亡的时候,开源生态却越来越火爆。 Flux效果越来越逼真就不多说了,SDXL依然还在出新花样,最近C站出了NAI新分支。 NAI基于 NoobAI 在动漫方面又独特的效果,和Pony、IL不尽相同。 今天推...
机器之心报道 机器之心编辑部 Q-Insight不再简单地让模型拟合人眼打分,而是将评分视作一种引导信号,促使模型深度思考图像质量的本质原因。有了会思考的“大脑”,视频云技术栈不仅得以重塑也让用户体验有了跃迁。 从 GPT-4o 吉卜力风、即梦的 3D 动画、再到苹果 Vision Pro,AI 视觉创作正迎来生产力大爆炸。一个重要问题随之浮现:如何评估...
**英伟达数亿美元收购贾扬清20人团队。 作者 | 程茜 编辑 | Panken 智东西4月8日报道,据The Information援引知情人士称,英伟达已经完成了对AI大牛、阿里前副总裁贾扬清创企Lepton AI的收购,这笔交易价值数亿美元。 目前,Lepton大约有20名员工。知情人士透露,Lepton的联合创始人贾扬清和白俊杰都已加入英伟...
2025开年,AI技术打得火热,正在改变程序员的职业命运: 阿里云核心业务全部接入Agent体系; 字节跳动30%后端岗位要求大模型开发能力; 腾讯、京东、百度开放招聘技术岗,80%与AI相关…… 大模型正在重构技术开发范式,传统CRUD开发模式正在被AI原生应用取代! 最残忍的是,业务面临转型,领导要求用RAG优化知识库检索,你不会;带AI团队,微调大...
收集了大模型/Agent平台的 system prompt,包括 ChatGPT, Manus, Claude, Grok 等等。 参考文献: [1] 地址:https://github.com/dontriskit/awesome-ai-system-prompts (文:NLP工程化) 收集了大模型、Agent平台的system prompt最...
mem-isolate:让运行不安全代码变得安全的神器。亮点: 利用 fork() 实现内存隔离,确保代码运行不影响主进程; 支持运行有内存泄漏风险的代码; 性能开销仅约1ms,性价比超高。 参考文献: [1] http://github.com/brannondorsey/mem-isolate (文:NLP工程化) mem-isolate:...
ExlLlamaV3:为现代消费级GPU优化的本地运行LLMs的量化和推理库。亮点: 支持多种架构,适配更多模型; EXL3量化格式,高效转换,仅需几分钟到几小时; 低内存需求,70B模型仅需16GB显存。 参考文献: [1] http://github.com/turboderp-org/exllamav3 (文:NLP工程化) ExlLla...
GitHub仓库的一个得力搜索助手:DeepGit,可以帮助你深度搜索/发现GitHub上的优质仓库。核心是能理解用户的模糊查询,自动扩展和完善搜索关键词,做智能分析,分析仓库的文档、分析代码结构以及技术栈,评估社区活跃度。会结合多个维度给出相关性评分,提供排序后的推荐列表。 参考文献: [1] github:https://github.com/zam...
给 AI 开发者分享一份值得收藏的学习资源合集:Learning AI。涵盖了从基础理论到实践应用,包括分词技术、模型架构、GPU 加速、向量数据库、视觉技术等核心知识。不仅包含了详细的技术笔记,还提供大量实践代码示例,如 GGML、Llama.cpp、嵌入向量操作等。项目目前在持续更新中,适合 AI 初学者或者想深入了解 AI 的开发者学习。 参考文献...