家里的小爱音箱经常找不到想听的歌,特别是一些小众歌曲或者收藏的本地音乐,实在有些头疼。此时,可通过 XiaoMusic 这个开源工具解放我们的小爱音箱,变身为 “无限点歌机”。通过 yt-dlp 自动下载音乐,让小爱音箱可播放任何想听的歌曲,还支持语音控制和本地音乐文件播放。主要功能: 语音控制播放任意歌曲,支持 “播放歌曲+歌名” 等自然口令 自动下载音...
在Github上发现一款开源的AI智能体效率工具Chaterm——专为运维人员设计,无论你是服务端开发者还是云服务器管理运维人员,都可以很好地适配。使用下来的感受就是,运维人员终于有了属于自己的「Cursor」,生产力指数级提升!过去运维人员经常使用的工具主要是本地终端、各个云服务平台提供的网页终端以及各种第三方软件。 这些工具也许足够Geek、足够好玩,但...
这个框架支持C/C++、Dart/Flutter 和 Ts/React-Native 的 API (而且接口都是相同的方便移植)。这个框架使用 GGML 当推理后端,支持任何与 Llama.cpp 兼容的 GGUF 模型。 目前来看放出的模型推理速度也很不错,iPhone 16 运行 Gemma3 1B 能达到 49 token/s,Qwen3 4B 能达到...
一个rust写的类似dos的小型操作系统。网络方面做的比较多,实现了从基础网络协议(如SLIP、ICMP)到应用层协议(如HTTP)的多种网络功能。 参考文献: [1] 配套介绍博客:https://blog.vxn.dev/rou2exos-rusted-edition [2] https://github.com/krustowski/rou2exO...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 全球电商、云计算巨头亚马逊对美国、巴西、加拿大、法国、德国等9个国家的,3,739位在ICT决策中扮演重要角色的高级IT决策者进行深度调查,发布了《全球企业生成式AI应用指数报告》。 ...
发现一个有趣的现象,知识库不管是开源的还是闭源的,都挺多的,还有人不停在问知识库到底哪个好用。 萝卜白菜,各有所爱。 每个人喜欢的样式功能都不一样,找个对味的知识库也不容易。 所以有发现的开源的合适的就给大家推荐,说不定就是你喜欢的。 今天推荐的这个还比较有特色,一起来看看具体的功能。 扫码加入AI交流群 获得更多技术支持和交流 (请注明自己的职业) 项...
当一个强大的多模态大模型(MLLM)在解决复杂的数学几何问题时,你是否想过它会“走神”? 我们发现,在进行多步、长链条的推理时,即便是最先进的 MLLM,也会逐渐“忘记”最初给它的图像信息,越来越依赖自己生成的文本,最终导致“一本正经地胡说八道”。我们称这种现象为“视觉遗忘”(Visual Forgetting)。 为了解决这个棘手的难题,我们非常荣幸地宣...
当前大语言模型(LLMs)在文本摘要、机器翻译、代码完成等各种复杂的语言处理任务中表现优异。LLMs 的作为利用人工智能算法的一种范式,包含海量参数的 LLMs 在大规模语料库上训练过程中不可避免地包含有害信息,恶意攻击者可以利用模型架构中的漏洞来越过 LLMs 的安全防护。 LLMs 安全边界探索-“越狱”(Jailbreak)作为一个新的研究方向,旨...
字节跳动与华东师范大学联合团队在 NeurIPS 2024 上发表的研究成果 TextHarmony,首次在 OCR 领域实现了视觉文本感知、理解与生成任务在单一模型中的统一,有效缓解了多模态生成中的模态不一致问题。本文将深入解读其技术原理与性能表现。 论文地址: https://arxiv.org/abs/2407.16364 代码仓库: https:...
文| 徐冰倩 6月20日,南都记者获悉,饿了么经内部调查发现物流主管韩鎏涉嫌职务犯罪,并向公安机关主动报案。近日,警方已传唤相关人员配合调查。饿了么方面称,秉持诚信廉洁文化,对触碰红线行为绝不姑息,坚决依法依规处理。 据悉,有消息称韩鎏被警方带走的初步原因或是涉及供应链利益输送,但对此饿了么方面未有正面回应。今年2月,饿了么宣布过一轮组织调整,董事长吴泽明...