Datawhale
@datawhalechinaOrganizationfor the learner,和学习者一起成长
On the leaderboard
| Rank | Repository | Stars |
|---|---|---|
| 998 | datawhalechina/hello-agents | 30,142 |
Top repositories by stars
- Python30,142
- datawhalechina/self-llm
《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程
Jupyter Notebook29,241 - datawhalechina/happy-llm
📚 从零开始构建大模型
Jupyter Notebook27,870 - datawhalechina/pumpkin-book
南瓜书:《机器学习》(西瓜书)公式详解
25,737 - datawhalechina/llm-cookbook
面向开发者的 LLM 入门教程,吴恩达大模型系列课程中文版
Jupyter Notebook23,608 - datawhalechina/leedl-tutorial
《李宏毅深度学习教程》(李宏毅老师推荐👍,苹果书🍎),PDF下载地址:https://github.com/datawhalechina/leedl-tutorial/releases
Jupyter Notebook16,424 - datawhalechina/easy-rl
强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
Jupyter Notebook13,854 - datawhalechina/llm-universe
本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/
Jupyter Notebook12,304 - datawhalechina/so-large-lm
大模型基础: 一文了解大模型基础知识
6,972 - datawhalechina/fun-rec
推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/
Python6,893 - datawhalechina/all-in-rag
🔍大模型应用开发实战一:RAG 技术全栈指南,在线阅读地址:https://datawhalechina.github.io/all-in-rag/
Python5,216 - datawhalechina/joyful-pandas
pandas中文教程
Jupyter Notebook5,109 - datawhalechina/competition-baseline
数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路
Jupyter Notebook4,734 - datawhalechina/tiny-universe
《大模型白盒子构建指南》:一个全手搓的Tiny-Universe
Jupyter Notebook4,653 - datawhalechina/easy-vibe
easy vibe 👋 一起 vibe| Learn Vibe Coding From 0 to 1| Vibe Coding 零基础|产品原型、AI 与全栈多平台开发教程|Tutorial on Product Prototype, AI & Full-Stack Multi-platform Dev
JavaScript4,258 - datawhalechina/vibe-vibe
AI for All: The First Systematic Vibe Coding Tutorial | From Zero to Full-Stack, Bring Your Ideas to Life | Live at: www.vibevibe.cn ;全民AI学习第一课,首个系统化 Vibe Coding 开源教程 | 零基础到全栈实战,让人人都能借助 AI 实现自己的想法与创意 | 在线地址:www.vibevibe.cn
Dockerfile4,089 - datawhalechina/llms-from-scratch-cn
仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理
Jupyter Notebook4,036 - datawhalechina/daily-interview
Datawhale成员整理的面经,内容包括机器学习,CV,NLP,推荐,开发等,欢迎大家star
3,587 - datawhalechina/thorough-pytorch
PyTorch入门教程,在线阅读地址:https://datawhalechina.github.io/thorough-pytorch/
Jupyter Notebook3,562 - datawhalechina/learn-nlp-with-transformers
we want to create a repo to illustrate usage of transformers in chinese
Shell3,159 - datawhalechina/hugging-llm
HuggingLLM, Hugging Future.
Jupyter Notebook3,064 - datawhalechina/team-learning
主要展示Datawhale的组队学习计划。
2,353 - datawhalechina/handy-ollama
动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/
Jupyter Notebook2,297 - datawhalechina/whale-quant
本项目为量化开源课程,可以帮助人们快速掌握量化金融知识以及使用Python进行量化开发的能力。
Jupyter Notebook2,161 - datawhalechina/statistical-learning-method-solutions-manual
机器学习方法习题解答,在线阅读地址:https://datawhalechina.github.io/statistical-learning-method-solutions-manual
Jupyter Notebook2,036 - datawhalechina/team-learning-data-mining
主要存储Datawhale组队学习中“数据挖掘/机器学习”方向的资料。
Jupyter Notebook1,821 - datawhalechina/key-book
《机器学习理论导引》(宝箱书)的证明、案例、概念补充与参考文献讲解。
Jupyter Notebook1,677 - datawhalechina/hands-on-data-analysis
动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果
Jupyter Notebook1,413 - datawhalechina/hugging-multi-agent
A tutorial based on MetaGPT to quickly help you understand the concept of agent and muti-agent and get started with coding development. 基于MetaGPT的多智能体入门与开发教程
CSS1,376 - datawhalechina/hello-claw
哈喽!龙虾 🙋♀️,首个体系化 openclaw 中文开源教程 | Adopt from scratch and build your first claw 🦞 来领养你的第一只龙虾!
JavaScript1,232 - datawhalechina/leetcode-notes
🐳 LeetCode 算法笔记:面试、刷题、学算法。在线阅读地址:https://datawhalechina.github.io/leetcode-notes/
1,072 - datawhalechina/dive-into-cv-pytorch
动手学CV-Pytorch版
Python968 - datawhalechina/wonderful-sql
Follow me,从 0 到 1 掌握 SQL。
967 - datawhalechina/torch-rechub
A Lighting Pytorch Framework for Recommendation Models (PyTorch推荐算法框架), Easy-to-use and Easy-to-extend. https://datawhalechina.github.io/torch-rechub/
Jupyter Notebook959 - datawhalechina/machine-learning-toy-code
《机器学习》(西瓜书)代码实战
Jupyter Notebook956 - datawhalechina/team-learning-nlp
主要存储Datawhale组队学习中“自然语言处理”方向的资料。
Jupyter Notebook941 - datawhalechina/every-embodied
仅需Python基础,从0构建自己的具身智能机器人;从0逐步构建VLA/OpenVLA/SmolVLA/Pi0, 深入理解具身智能
Jupyter Notebook893 - datawhalechina/team-learning-program
主要存储Datawhale组队学习中“编程、数据结构与算法”方向的资料。
Jupyter Notebook843 - datawhalechina/intro-mathmodel
《数学建模导论》教程,全网最全数学建模模型与算法教程系列,带你走进数学建模的大门!
795 - datawhalechina/handy-multi-agent
This is a multi agent tutorial based on the CAMEL framework, aimed at understanding how to build an Agent Society from the ground up!
Jupyter Notebook748 - datawhalechina/unlock-deepseek
DeepSeek 系列工作解读、扩展和复现。
Python712 - datawhalechina/d2l-ai-solutions-manual
《动手学深度学习》习题解答,在线阅读地址如下:
Jupyter Notebook564 - datawhalechina/agentic-ai
本项目围绕吴恩达老师在DeepLearning.AI出品的Agentic-ai系列课程,为学习者打造中文翻译与知识整理教程。项目提供课程内容翻译、知识点梳理和示例代码解读等内容,欢迎大家Star!
Jupyter Notebook530 - datawhalechina/fantastic-matplotlib
Matplotlib中文教程,在线阅读地址:https://datawhalechina.github.io/fantastic-matplotlib/
Python527 - datawhalechina/base-llm
从 NLP 到 LLM 的算法全栈教程,在线阅读地址:https://datawhalechina.github.io/base-llm/
Jupyter Notebook508 - datawhalechina/powerful-numpy
巨硬的NumPy
Jupyter Notebook479 - datawhalechina/learn-python-the-smart-way
聪明方法学Python,简明且系统的 Python 入门教程。
Jupyter Notebook390 - datawhalechina/team-learning-cv
主要存储Datawhale组队学习中“计算机视觉”方向的资料。
Jupyter Notebook385 - datawhalechina/vced
VCED 可以通过你的文字描述来自动识别视频中相符合的片段进行视频剪辑。该项目基于跨模态搜索与向量检索技术搭建,通过前后端分离的模式,帮助你快速的接触新一代搜索技术。
Python384 - datawhalechina/llm-deploy
大模型/LLM推理和部署理论与实践
383 - datawhalechina/learn-python-the-smart-way-v2
聪明办法学Python,简明且系统的 Python 入门教程第二版。
Jupyter Notebook382 - datawhalechina/self-dify
本教程将全面指导你如何快速搭建自己的AI应用环境,从Docker桌面版的安装与配置开始,到本地部署Dify并自定义AI助手功能,让你轻松实现“猜病例”、“甜蜜哄人”、“新生入学指南”、“小红书读书卡片”与“面试宝典”等多种特色AI应用。并教会你从基础智能体到使用工作流,再到知识库、DeepResearch、数据库、MCP、复杂任务编排等高阶任务,由浅到深的学习掌握基于dify的大模型应用开发。
377 - datawhalechina/office-automation
python自动化办公
Jupyter Notebook367 - datawhalechina/awesome-compression
模型压缩的小白入门教程,PDF下载地址 https://github.com/datawhalechina/awesome-compression/releases
357 - datawhalechina/juicy-bigdata
🎉🎉🐳 Datawhale大数据处理导论教程 | 大数据技术方向的开篇课程🎉🎉
Python350 - datawhalechina/yolo-master
yolo master 本课程主要对yolo系列模型进行介绍,包括各版本模型的结构,进行的改进等,旨在帮助学习者们可以了解和掌握主要yolo模型的发展脉络,以期在各自的应用领域可以进一步创新并在自己的任务上达到较好的效果。
325 - datawhalechina/math-for-ai
Datawhale开源教程《人工智能的数学基础》
Jupyter Notebook294 - Jupyter Notebook287
- datawhalechina/agent-skills-with-anthropic
本项目围绕吴恩达老师在DeepLearning.AI出品的agent-skills-with-anthropic系列课程,为学习者打造中文翻译与知识整理教程。项目提供课程内容翻译、知识点梳理和示例代码解读等内容,欢迎大家Star!
Python281 - datawhalechina/grape-book
图深度学习(葡萄书),在线阅读地址: https://datawhalechina.github.io/grape-book
HTML277 - datawhalechina/joyrl
An easier PyTorch deep reinforcement learning library.
Python254 - datawhalechina/wow-fullstack
wow-fullstack,令人惊叹的全栈开发教程
TypeScript250 - datawhalechina/DOPMC
Datawhale 开源项目管理委员会(Datawhale Open-source Project Management Committee,简称DOPMC)
Python249 - datawhalechina/leegenai-tutorial
《李宏毅生成式人工智能教程》,PDF下载地址:https://github.com/datawhalechina/leegenai-tutorial/releases
243 - datawhalechina/fun-transformer
通过带领大家解读Transformer模型来加深对模型的理解
240 - datawhalechina/easy-vecdb
📚 从零开始的向量数据库原理与实践教程,在线阅读地址:https://easy-vecdb.datawhale.cc/
Jupyter Notebook239 - datawhalechina/coze-ai-assistant
该项目围绕 Coze 打造 AI 私人提效助理展开,整合实用 AI 工作流并做拆解,同时准备提示词手册和案例手册,旨在展示项目可行性,帮助学习者更好地理解和实操相关技能。
239 - datawhalechina/wow-rag
A simple and trans-platform rag framework and tutorial
Jupyter Notebook230 - datawhalechina/wow-agent
A simple and trans-platform agent framework and tutorial
Jupyter Notebook201 - datawhalechina/smoothly-vslam
VSLAM开源基础教程,各章节练习代码
C++192 - 191
- datawhalechina/huawei-od-python
华为OD算法题解
Python187 - datawhalechina/team-learning-sql
主要存储Datawhale组队学习中“SQL”方向的资料。
187 - datawhalechina/hugging-vis
Hugging Vision, Hugging AGI.
178 - datawhalechina/diy-llm
🎓 系统性大语言模型构建课程|🛠️ 覆盖预训练数据工程、Tokenizer、Transformer、MoE、GPU 编程 (CUDA/Triton)、分布式训练、Scaling Laws、推理优化及对齐 (SFT/RLHF/GRPO)|🚀 6 个渐进式作业 + 代码驱动,建立 LLM 全栈认知体系
Jupyter Notebook176 - datawhalechina/faster-git
a chinese tutorial of git
172 - datawhalechina/open-ai-general-course
OPEN AI通识课
169 - datawhalechina/post-training-of-llms
本项目是一个围绕 DeepLearning.AI 出品的 Post-Training for LLMs 系列课程,为国内学习者量身打造的中文翻译与知识整理教程。项目提供课程内容翻译、知识点梳理和示例代码等内容,旨在降低语言门槛,让更多学生、研究人员和开发者系统掌握大语言模型(LLM)后训练阶段的核心技术与实践方法。
Jupyter Notebook166 - datawhalechina/free-excel
开源Excel教程。
CSS166 - datawhalechina/what-is-vs
向量检索与 RAG 实践:技术、实现与应用
155 - Jupyter Notebook146
- datawhalechina/code-your-own-llm
一份全栈式大语言模型参考指南,用最简洁的代码帮助你端到端定义模型从零训练到工程落地的每一个细节
145 - datawhalechina/vibe-blog
Vibe-Blog是一个基于Multi-Agent 架构的万字长文技术博客生成AI助手,支持深度调研、智能配图、Mermaid 图表、代码集成、专业排版的各种专业技术博客写作中所需要的能力, 真正做到了 "输入一句话, 一键输出图文混合的万字技术长文, 轻轻松松做到日更万字长文技术博客",将晦涩的技术知识转化为通俗易懂的科普文章,让每个人都能轻松理解复杂技术,在 AI 时代扬帆起航.
Python143 - datawhalechina/sweetalk-design-pattern
基于《大话设计模式》对设计原则和设计模式进行解读。
C++137 - 130
- datawhalechina/llm-preview
理工科-大模型入门实训课程
Jupyter Notebook118 - datawhalechina/ai-edu-for-kids
面向中小学的人工智能通识课开源课程
104 - datawhalechina/handy-n8n
handy-n8n, learn n8n by doing
JavaScript103 - datawhalechina/ml-for-security
网络安全中的人工智能方法,总结我在中国科学院大学的学习以及自己整理的资料、方法,给大家分享出来
99 - datawhalechina/unlock-hf
解锁HuggingFace生态的百般用法
HTML98 - datawhalechina/hands-dirty-nlp
本课程面对具有一定机器学习基础,但尚未入门的NLPer或经验尚浅的NLPer,尽力避免陷入繁琐枯燥的公式讲解中,力求用代码展示每个模型背后的设计思想,同时也会带大家梳理每个模块下的技术演变,做到既知树木也知森林。
Jupyter Notebook89 - datawhalechina/hml-solutions
《动手学机器学习》习题解答
Jupyter Notebook88 - datawhalechina/releasing-research-code
发布研究论文代码的小技巧
88 - datawhalechina/desktop-pet
基于文心一言和树莓派Pico的最简易桌面宠物
Python86 - datawhalechina/paper-chart-tutorial
《科研论文配图》组队学习
85 - datawhalechina/openclaw-tutorial
OpenClaw 学习教程 - 一周打造跨设备 AI 助手
80