推荐 6 个本周 yyds 的 GitHub 项目。

作者:喜爱编程日期:2025/10/2

01

微软开源的文档转换工具

MarkItDown 用于将各种常见格式的文档转换为 Markdown 格式。

包括 PDF、PPT、Word、Excel、图片、音频、HTML、JSON等,甚至还能处理 ZIP 压缩包内的多个文件、YouTube 视频转录文本以及电子书 EPub 等。

它尤其适合需要将文档内容提取为结构化文本,并用于大模型处理或文本分析任务的情景。

其实仅限这个场景,因为项目官方说可以保留表格、排版啥的**,实测并没有。。。**

PDF 文件转换,左边屏是源文件,右半屏是转换后的MD,发现标题并没有保留。

表格类型 PDF 的转换效果如下,其实得到的 Markdown 效果就比较差了。

如果是转换比较标准的 Excel 表格,效果还是不错的:

再来看看 PPT 文件,转换的效果,emmmm

这是提取文字吧。。

02

命令行 AI 编程助手

Codebuff 也是一个基于命令行的 AI 编程助手。

它不像许多工具那样只依赖一个大模型,而是采用一种多智能体协同工作的架构。

它个任务,协调多个各司其职的智能体一起工作。

项目官方说在模拟真实任务的评估中,成功率达到了 61%,优于 Claude 53%。

使用 Codebuff 非常简单,通过 npm 全局安装它之后,进入你的项目目录,在终端里直接运行 codebuff 命令,然后用自然语言告诉它你想做什么。

03

推特推荐算法

这个开源项目是推特自家平台最核心的推荐算法。

包含了一系列服务、任务和框架,它们共同协作,来决定用户会在「为你推荐」时间线、搜索、探索页和通知中看到什么内容。

它并不是一个单一算法,而是一整套复杂的技术生态。

感兴趣的去看看吧。

04

Mac 电脑上运行大模型

mlx-lm 是一个专为苹果芯片设计的开源项目,让用户能轻松地在 Mac 电脑上运行各种大语言模型。

使用 pip 或 conda 即可快速安装。

安装后,无需编写代码,直接在终端中输入简单命令,就可以让模型回答问题或进行多轮对话,非常方便。

而且它成了 Hugging Face Hub,发现好玩的模型直接下载就行了。这个开源项目可能比较小众,不做更多介绍,感兴趣自己去看看。

05

Perplexity 开源平替

Perplexica 是知名产品 Perplexity AI 的开源替代方案。支持 Mac、Linux、Windows。

是一个由 AI 驱动的搜索引擎,与传统搜索不同,Perplexica 不仅仅返回一堆链接。

它会在理解用户问题意图的基础上,自动抓取网络信息,并对内容进行梳理和整合,最终生成一个清晰、连贯且带有来源引用的答案。

06

ChinaTextbook

之前介绍过,这个开源项目又登上了本周 GitHub 热搜。

项目的主要目标是收集并免费分享中国内地小学、初中、高中乃至大学的PDF版教材。

比如小学中的课程,数学、美术、科学、英语、语文,甚至体育与健康、艺术、书法、音乐等等 10 大课程配套的教学材料都有。

最后总结

如果你对编程感兴趣,想要学习python、人工智能、Java、前端,这里给大家分享一份编程全套学习资料,都是我自己学习时整理的,希望可以帮到你,一起加油!

1️⃣零基础入门

① 学习路线

对于从来没有接触过编程的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

② 路线对应学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手编程~

2️⃣国内外书籍、文档

① 文档和书籍资料

3️⃣工具包+项目源码合集

①Python工具包

学习Python常用的开发软件都在这里了!每个都有详细的安装教程,保证你可以安装成功哦!

②编程实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。100+实战案例源码等你来拿!

③小游戏源码

如果觉得上面的实战案例有点枯燥,可以试试自己用Python编写小游戏,让你的学习过程中增添一点趣味!

4️⃣大厂面试题

我们学会了编程之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

完整版获取方式:


推荐 6 个本周 yyds 的 GitHub 项目。》 是转载文章,点击查看原文


相关推荐


【数据挖掘】基于随机森林回归模型的二手车价格预测分析(数据集+源码)
码银10/2/2025

本研究运用随机森林回归模型对汽车价格进行预测。通过对包含多种汽车属性的数据集进行预处理,包括对分类变量的独热编码,将其划分为训练集与测试集。利用训练集数据拟合随机森林模型,并使用测试集数据进行预测与评估。同时,借助多种可视化手段深入分析模型性能与数据特征。数据源:https://www.kaggle.com/datasets/vrajesh0sharma7/used-car-price-prediction选择随机森林回归模型作为预测工具,并设定决策树数量为100(),同时固定随机种子(


iOS 26 系统流畅度剖析:Liquid Glass 动画表现 + 用户反馈
代码背锅人日志9/30/2025

本文聚焦 iOS 26 系统流畅度,结合用户反馈、Liquid Glass 视觉变革与性能挑战,介绍如何用 KeyMob + Instruments 记录帧率 /卡顿 /动画延迟,并给出实战流程与优化建议,帮助开发者评估新版系统中界面的真实流畅性。


优先级队列(堆)-1046.最后一块砖的重量-力扣(LeetCode)
1白天的黑夜19/30/2025

个人主页:1白天的黑夜1-CSDN博客专栏:力扣刷题录_1白天的黑夜1的博客-CSDN博客、企鹅程序员:Linux 系统与网络编程_1白天的黑夜1的博客-CSDN博客目录一、题目解析1、选出两块最重的石头意为第一重和第二重或同样重2、如果只剩一块石头,返回石头的重量;如果没有石头返回0二、算法原理解法:优先级队列解法步骤:三、代码示例一、题目解析优先级队列就是堆,而堆又有大根堆和小根堆,本题需要用到的就是大根堆这里模板参数Compare的缺省值为less,也就是按照从根往下,根比孩子大;而小根堆则是grea


CodeBuddy配套:如何配置AI编程总工程师spec-kit
小虎AI生活2025/10/2

我是小虎,浙江大学计算机本硕,专注AI编程。 如果AI能像总工程师一样,先帮你把图纸画好,再动手干活,那该多爽? AI编程学习群里,有学员在吐槽,AI编程时经常“失忆”,写着着就忘了前面的上下文,让人抓狂 🤯。 这不仅是学员们踩过的坑,也是我自己的惨痛教训。 昨天我也写了一篇文章,介绍我的土办法。 [CodeBuddy实战:防止AI编程跑偏的土办法,能抓老鼠就是好猫!] 今天,我要给你们安利一个刚出炉的神器,它能彻底改变你和AI协作写代码的方式。 而且,我敢说,全网我可能是第一篇教程写C


Vue3 中的双向链表依赖管理详解与示例
excel2025/10/3

在 Vue3 的响应式系统中,双向链表是一个非常重要的数据结构。相比 Vue2 使用数组来存放依赖,Vue3 选择链表的原因在于效率更高,尤其是在频繁收集和清理依赖时,链表可以显著优化性能。本文将通过讲解和示例代码,帮助你理解这一点。 为什么要用双向链表 在响应式依赖收集过程中,Vue 需要完成两件事: 收集依赖:当访问响应式数据时,要记录当前副作用函数(effect)。 清理依赖:当副作用函数重新运行或失效时,需要把它从依赖集合里移除。 如果依赖集合使用数组: 删除某个依赖需要遍历整个


从 “Hello AI” 到企业级应用:Spring AI 如何重塑 Java 生态的 AI 开发
草莓熊Lotso2025/10/4

🔥个人主页:@草莓熊Lotso 🎬作者简介:C++研发方向学习者 📖个人专栏: 《C语言》 《数据结构与算法》《C语言刷题集》《Leetcode刷题指南》 ⭐️人生格言:生活是默默的坚持,毅力是永久的享受。 前言:当大模型浪潮席卷软件开发领域时,Java 开发者常常面临一个困境:一边是 PyTorch、LangChain 等 Python 生态的 AI 工具链蓬勃发展,一边是企业现有系统中大量的 Spring 技术栈难以快速接入 AI 能力。而 Spring AI 的出现


Android Jetpack 核心组件实战:ViewModel + LiveData + DataBinding 详解
马 孔 多 在下雨2025/10/5

Android Jetpack 核心组件实战:ViewModel + LiveData + DataBinding 详解 在 Android 开发中,我们经常会遇到屏幕旋转数据丢失、UI 与逻辑耦合紧密、数据更新无法自动同步 UI 等问题。Google 推出的 Jetpack 架构组件可以很好地解决这些问题,本文将对 ViewModel、LiveData 和 DataBinding 三个核心组件进行讲解,从基础概念到实战案例,完整讲解这三个组件的使用方法与联动逻辑。 一、ViewModel:


v你真的会记笔记吗?AI的答案可能让你意外
万少 VIP.5 如鱼得水2025/10/7

这段时间我在准备一个行业调查,调研资料几乎全来自视频会议、线上讲座和播客。 内容是很丰富,但问题也随之而来:一个小时的视频回放,想找个观点得快进倒退十几次,遇到灵感还得赶紧切出去做笔记,效率低到崩溃。 看不完,根本看不完…… 正好我朋友是一个AI发烧友,他就推荐我用了一个专注做AI笔记的工具。 坦白讲,最开始我没抱太大期待,心想不就是转写嘛。但真用了两周后,我发现它完全改变了我的学习和工作流。 这个工具叫Ai好记: 网址:aihaoji.com/zh?utm_sour… 输入口令【万少】可以


JAVA算法练习题day34
QiZhang6032025/10/8

43.验证二叉搜索树 要知道二叉搜索树的中序遍历结果是升序序列 # Definition for a binary tree node. # class TreeNode(object): # def __init__(self, val=0, left=None, right=None): # self.val = val # self.left = left # self.right = right class Solution(o


面试真实经历某节跳动大厂Java和算法问答以及答案总结(一)
360_go_php2025/10/10

Java面试问题与解答 常见的GC回收器 - Serial GC: 适合单线程环境,暂停时间较长。 - Parallel GC: 多线程垃圾回收,适合多核处理器,停顿时间较短。 - CMS (Concurrent Mark-Sweep): 适合响应时间要求高的应用,通过多线程并发清除垃圾。 - G1 GC: 适用于大内存系统,目标是尽量减少GC停顿时间,分区回收。​编辑 SpringMVC的请求过程 - 流程: 用户发起请求 → 前端控制器(DispatcherServlet)接收请求

首页编辑器站点地图

Copyright © 2025 聚合阅读

License: CC BY-SA 4.0