**关注我,记得标星不迷路哦~ 1: notion-mcp-server notion-mcp-server是Notion API的MCP服务器实现,支持通过指令或内容ID与Notion交互。 notion-mcp-server 是一个项目,它为 Notion API 实现了 MCP (Model Context Protocol) 服务器。这使得 A...
现在提及真人风格模型,无一例外的会推荐各种Flux。 不过,Flux对显存要求比较高,一些还在使用上古显卡的爱好者,跑Flux非常吃力,甚至低于8G的基本跑不起来。 如今,依然有一些优秀的SDXL模型还在更新,并优化至4G显存就可以很好的效果。 今天推荐一个真人风格的SDXL模型,效果不亚于Flux。CyberRealistic XL。 1、微笑的欧美女孩...
AI 圈抢人,各种烧钱、给高薪大家都知道,但今天听到的这个消息,感觉又上了一个“强度”—— Business Insider 挖出来说,Google DeepMind 为了不让人才跳槽去对手那儿,直接用上了“大杀器”: 如果你在谷歌DeepMind 工作,想换个环境,结果公司跟你说:“行,批准你离职。接下来一年,工资我们照发,你不用干活,但有个条件——不...
新智元报道 编辑:编辑部 HYZ 【新智元导读】Llama 4刚出世就被碾压!英伟达强势开源Llama Nemotron-253B推理模型,在数学编码、科学问答中准确率登顶,甚至以一半参数媲美DeepSeek R1,吞吐量暴涨4倍。关键秘诀,就在于团队采用的测试时Scaling。 Llama 4诞生不过3天,反手就被超越了。 刚刚,英伟达官宣开源「...
GPT-ImgEval团队 投稿 量子位 | 公众号 QbitAI GPT-4o图像生成架构被“破解”了! 最近一阵,“万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红,人们随之好奇: 4o图像生成的架构底层逻辑到底是什么?GPT-4o究竟强在哪?存在哪些短板? 作为解答,北京大学、中山大学等多家科研机构共同推出GPT-ImgEval,首次系统评估了GP...
在机器学习和教育场景中,从复杂文档中提取结构化数据一直是痛点。 但在日常教学或构建机器学习数据集时,常规 OCR 工具往往力不从心,尤其面对多语言文字、数学公式、图表示意图、复杂排版的学术材料,准确率低、结构混乱,严重影响效率。 今天为大家推荐一款专为“教育场景”和“机器学习训练”量身定制的 OCR 神器:Versatile-OCR-Program。 它不...
在 GitHub 上发现一个简单高效的 LLM 强化学习库:nanoAhaMoment。仅需单个 80G GPU,无需 RL 库,使用 3B 基础模型,全参数微调,就能实现类似 DeepSeek R1-zero 的风格训练,而且整个过程只需不到 10 小时。提供了 Jupyter notebook 笔记和通俗易懂的代码,并且附有详细教程视频,轻松上手学习。 ...
分享 GitHub 上一份精心整理的检索增强生成(RAG)技术资源集合:Awesome-RAG。这份列表系统整理了 RAG 相关的理论知识、实现方法、开发框架、关键技术以及评估指标等内容。从基本原理到高级技术详解,再到实现步骤,有助于我们更好学习与使用 RAG。 参考文献: [1] GitHub:https://github.com/Danielskry...
教育场景里的OCR工具,专门处理教育材料,可以从像试卷这种复杂的教育材料中提取结构化数据的多模态OCR工具:Versatile-OCR-Program。支持多语言文本、数学公式、表格、图表等元素提取,还能以语义注释的方式进行标注,生成自然语言描述。支持日语、韩语、英语,可扩展到其他语言,输出格式为JSON或Markdown,支持复杂的布局。 参考文献: ...