程序员面试、算法研究、机器学习、大模型/ChatGPT/AIGC、论文审稿、具身智能、RAG等11大系列集锦 - 悦读

程序员面试、算法研究、机器学习、大模型/ChatGPT/AIGC、论文审稿、具身智能、RAG等11大系列集锦

作者：July，七月在线创始人兼CEO、结构之法算法之道blog之博主
时间：2010年10月-2024年1月，一直在不断更新中..
出处：http://blog.csdn.net/v_JULY_v

前言

开博10年有余，回首这10余年，自己一开始侧重编程、面试、数据结构/算法，中途侧重数据挖掘、机器学习，近期则专攻AIGC/ChatGPT，而自己在本blog上也着实花费了巨大的时间和精力，写的东西可能也够几本书的内容了。然不管怎样，希望我能真真正正的为读者提供实实在在的价值与帮助。

下面，敬请观赏。有任何问题，欢迎随时不吝指正(同时，若你也能帮助回复blog内留言的任何朋友的问题，欢迎你随时不吝分享&回复，我们一起讨论，互帮互助，谢谢)。

无私分享，造福天下

以下是本blog内的微软面试100题系列、经典算法研究系列、程序员编程艺术系列、红黑树系列、机器学习十大算法系列、AIGC/ChatGPT等6大经典原创系列作品与一些重要文章的集锦：

一、微软面试100题系列

横空出世，席卷Csdn--评微软等数据结构+算法面试100题（微软面试100题系列原题+答案索引）
微软100题（微软面试完整第1-100题）
微软面试100题2010年版全部答案集锦（含下载地址）
全新整理：微软、谷歌、百度等公司经典面试100题[第101-160题]
全新整理：微软、Google等公司的面试题及解答[第161-170题]
十道海量数据处理面试题与十个方法大总结（十道海量数据处理面试题）
海量数据处理面试题集锦与Bit-map详解（十七道海量数据处理面试题）
教你如何迅速秒杀掉：99%的海量数据处理面试题（海量数据处理PDF）
九月腾讯，创新工场，淘宝等公司最新面试三十题（第171-200题）（2011年度九月最新面试三十题）
十月上旬百度，阿里巴巴，迅雷搜狗最新面试七十题（第201-270题）（2011年度十月上旬七十题）
十月下旬腾讯，网易游戏，百度最新校园招聘笔试题集锦(第271-330题) （2011年度十月下旬校招）
九月十月百度人搜，阿里巴巴，腾讯华为笔试面试八十题(第331-410题) （2012年度笔试面试八十题）
九月百度，迅雷，华为，阿里巴巴，最新校招笔试面试十(第411-470题) （2013年度校招笔试面试十题）

上述微软面试100题系列(共计11篇文章，300多道面试题)的PDF文档近期已经制作出来，其下载地址为：微软面试100题系列之高清完整版PDF文档[带目录+标签]by_July_pdf-C++文档类资源-CSDN下载

二、十五个经典算法研究与总结、目录+索引

最新的十五个经典算法研究的PDF文档0积分下载地址如下(1个月5000+人次下载)

三、程序员编程艺术第一~四十章集锦与总结

程序员编程艺术第1~37章带标签的最新PDF下载地址为（3天3000人下载）

编程艺术github优化版阅读地址：https://github.com/julycoding/The-Art-Of-Programming-By-July-2nd

重大消息：经过反复修改、优化，编程艺术系列最终成书出版，并改名为《编程之法：面试和算法心得》，目前京东、当当、亚马逊等各大网店均已有现货销售。京东抢购地址：《编程之法：面试和算法心得(异步图书出品)》(July)【摘要书评试读】- 京东图书，且23年Q4将上市第二版

四、红黑树、B树、R树、Trie树

五、机器学习十大算法系列

5.1 AI数学基础
概率统计极简入门：通俗理解微积分/期望方差/正态分布前世今生(23修订版)
一文通透优化算法：从随机梯度、随机梯度下降法到牛顿法、共轭梯度
..
5.2 AI工程实践
一文读懂特征工程
教你从头到尾利用DL学梵高作画：GTX 1070 cuda 8.0 tensorflow gpu版
没GPU也能玩梵高作画：Ubuntu tensorflow CPU版
基于torch学汪峰写歌词、聊天机器人、图像着色/生成、看图说话、字幕生成
教你从头到尾利用DQN自动玩flappy bird（全程命令提示，GPU+CPU版）
手把手教你搭建caffe及手写数字识别（Ubuntu下且附mac、纯通俗教程）
如何从零起步学习AI（附学习路线）
GAN之父在NIPS 2016上做的报告：两个竞争网络的对抗（含译文下载）
Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛
BAT机器学习面试1000题系列（第1~500题）
5.3 AI经典模型：从SVM XGBoost CNN RNN LSTM
数据挖掘领域十大经典算法初探
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法，2012年11月
从决策树学习谈到贝叶斯分类算法、EM、HMM，2012年5月
支持向量机通俗导论（理解SVM的三层境界） PDF下载 LaTeX版本1 LaTeX版本2，2012年6月
最大熵模型中的数学推导，2014年10月
如何通俗理解EM算法，2018年8月
Adaboost 的原理与推导 LaTeX版本下载，2014年11月
从拉普拉斯矩阵说到谱聚类，2014年11月
从贝叶斯方法谈到贝叶斯网络 LaTeX版本下载，2014年11月
通俗理解LDA主题模型 LaTeX版本下载，2014年11月
CNN笔记：通俗理解卷积神经网络，2016年7月
图解CNN：通过100张图一步步理解CNN，2018年3月
一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD，2018年5月
通俗理解kaggle比赛大杀器xgboost，2018年8月
如何从RNN起步，一步一步通俗理解LSTM，2019年5月
如何通俗理解Word2Vec，2019年10月首发，后2023年全面修订
GNN通俗笔记：图神经网络在推荐/广告中的应用，2021年3月
通俗理解卡尔曼滤波（感知融合的经典算法），2021年9月
..

六、大模型与ChatGPT系列：原理、论文、代码、应用

七、AIGC生成一切系列(含多模态)：图像/视频/代码生成

7.1 AIGC/AI绘画/CV多模态/图像生成
图像生成发展起源：从VAE、VQ-VAE、扩散模型DDPM、DETR到ViT、Swin transformer
AI绘画原理解析：从CLIP、BLIP到DALLE、DALLE 2、DALLE 3、Stable Diffusion
图像分割的大变革：从SAM(分割一切)到FastSAM、MobileSAM
文生图的最新进展：从一致性模型CMs、LCM、SDXL到Stable Diffusion3、SDXL-Lightning
7.2 视频生成，含OpenAI首个视频生成模型sora
Sora之前的视频生成发展史：从Gen2、Emu Video到PixelDance、SVD、Pika 1.0
视频生成Sora的全面解析：从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等
视频生成Sora的从零复现：从Latte、Open-Sora 1.0到StreamingT2V
Google发布Genie硬杠Sora：通过大量无监督视频训练最终生成可交互虚拟世界
7.3 其他生成：代码生成
代码生成的原理解析：从Codex、GitHub Copliot到CodeLlama、CodeGeex

八、七月论文大模型：含论文的审稿、阅读、写作、修订

8.1 七月论文审稿GPT(从第1版到第6版)
七月论文审稿GPT第1版：通过3万多篇paper和10多万的review数据微调RWKV
七月论文审稿GPT第2版：用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4
七月论文审稿GPT第2.5和第3版：分别微调GPT3.5、Llama2 13B以扩大对GPT4的优势
七月论文审稿GPT第3.2版和第3.5版：通过paper-review数据集分别微调Mistral、gemma
七月论文审稿GPT第4版：通过paper-review数据集微调Mixtral-8x7b，对GPT4胜率超过80%
七月论文审稿GPT第4.2版：通过15K条paper-review数据微调Llama2 70B(含各种坑)
七月论文审稿GPT第4.5版、第4.6版、第4.8版：提升大模型数据质量的三大要素
七月论文审稿GPT第5版：拿我司七月的早期paper-7方面review数据集微调LLama 3
一文速览Gemma及其微调：通过我司七月的早期paper-7方面review数据集微调Gemma2(第5.2版)
...
康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)
..
8.2 论文的阅读：翻译、检索、摘要、对话
学术论文GPT的源码解读与二次开发：从ChatPaper到gpt_academic
// 待更..
8.3 论文的写作：idea的提出(涉及论文的抓取检索召回排序提炼)
基于大模型的idea提炼：围绕论文和引用提炼idea之ResearchAgent
// 待更..
8.4 论文的修订：语法纠错、润色等
// 待更
8.5 部分所需的相关技术：长度扩展等
从Mistral 7B到MoE模型Mixtral 8x7B的全面解析：从原理分析到代码解读
大模型上下文扩展之YaRN解析：从直接外推ALiBi、位置插值、NTK-aware插值、YaRN
大模型上下文长度的超强扩展：从LongLoRA到LongQLoRA(含源码剖析)
大模型上下文长度扩展的最新方法：得克萨斯SelfExtended、微软LongRoPE、陈丹琦团队CEPE

九、大模型机器人系列(具身智能、人形机器人)

9.1 模仿学习的集中爆发：斯坦福机器人Mobile Aloha、UMI、DexCap
以Mobile ALOHA为代表的模仿学习的爆发：从Dobb·E、Gello到斯坦福ALOHA、UMI、DexCap、伯克利FMB
ACT的原理解析：斯坦福炒虾机器人Moblie Aloha的动作分块算法ACT
逐行解读ACT的实现：斯坦福Mobile Aloha之动作分块算法ACT的代码剖析、训练部署
UMI——斯坦福刷盘机器人：从手持夹持器到动作预测Diffusion Policy(含代码解读)
DexCap——斯坦福李飞飞团队泡茶机器人：更好数据收集系统的原理解析、源码剖析
//..
9.2 人形机器人，比如斯坦福HumanPlus、加州大学TeleVision等
HumanPlus——斯坦福ALOHA团队开源的人形机器人：融合影子学习技术、RL、模仿学习
斯坦福人形机器人HumanPlus的代码解读与复现关键：从HST到HIT、HardWare
人体姿态估计WHAM与手势估计HaMeR——人形机器人背后的关键技术之一
Open-TeleVision——通过VR沉浸式感受人形机器人视野：兼备远程控制和深度感知能力
9.3 预训练 + RL机器人
带RL的机器人：从类似预测下一个token的伯克利Digit到CMU 18万机器人
..
9.4 视觉语言机器人的大爆发
视觉语言机器人的大爆发：从RT2、VoxPoser、OK-Robot到Figure 01、清华CoPa
Google视觉机器人超级汇总：从RT、RT-2到AutoRT/SARA-RT/RT-Trajectory、RT-H
..

十、RAG知识库问答系列

10.1 七月RAG第一版之探索，基本流程与基本框架
LangChain+LLM的本地知识库问答：从企业单文档问答到批量文档问答
知识库问答LangChain+LLM的二次开发：商用时的典型问题及其改进方案
一文通透Text Embedding模型：从text2vec、openai-ada-002到m3e、bge
一文掌握文本语义分割：从朴素切分、Cross-Segment到阿里SeqModel
10.2 七月RAG第二版之探索，通用文档处理
RAG进阶之通用文档处理：从RAGFlow、TextMonkey到mPLUG-DocOwl 1.5

十一、智能体Agent项目

十二、其它重要文章节选

12.1、经典数据结构 & 算法系列
精通八大排序算法系列：一之续、快速排序算法的深入分析

几个最短路径算法Floyd、Dijkstra、Bellman-Ford、SPFA的比较

12.3、推荐 & 搜索算法系列
细数二十世纪最伟大的10大算法
当今世界最为经典的十大算法--投票进行时（本blog将评选出当今世界最为经典的十大算法）
推荐引擎算法学习导论
搜索引擎技术之概要预览

Machine Learning读书会,面试算法讲座,创业活动,算法班(14年10月) （含所有线下讲座PPT 集锦）
结构之法算法之道blog博文集锦第6、第7期CHM文件第8期第9期下载（第9期截止到2014年12月9日）
....

后记

世上本无路，走的人多了，也就成了路。世上本无免费的午餐，分享的人多了，也就造就了开源的辉煌

如果你发现了本blog中的任何一问题，请一定不吝指正，thanks。此外，你可以永久通过搜索引擎搜索本博客名称的前4个字，即：“结构之法” 这4个关键字，进入本博客。最后，感谢CSDN，感谢所有一直以来关注本blog的所有朋友。谢谢大家，谢谢。

转发送书

欢迎大家转发下条微博：Sina Visitor System，我会不定期抽奖，经典IT图书大赠送：

2015年，July团队正式创业，上半年推出在线教育网站：精品课程（面试、算法、机器学习在线课程）。July、二零一五年九月十五日。

另，我的新书《编程之法：面试和算法心得》终于在2015年10月14日上架开卖了！京东抢购地址：《编程之法：面试和算法心得(异步图书出品)》(July)【摘要书评试读】- 京东图书。目前，京东、当当、亚马逊等各大网店均已有现货销售，且时隔8年之后，24年终于将上市第二版

悦读

道可道，非常道；名可名，非常名。无名，天地之始，有名，万物之母。故常无欲，以观其妙，常有欲，以观其徼。此两者，同出而异名，同谓之玄，玄之又玄，众妙之门。

东北大学2024春季数字逻辑实验LCD驱动使用说明

上下位机通讯协议

用Python爬虫对城市公交、地铁站点和线路数据采集_交通数据采集代码(1)

电转气电–气综合能源优化调度 P2G 日前调度 MATLAB程序内容：电转气技术使电力

Spark-RDD 分区

【zz】dpdk全面分析

动态规划0-1背包问题，python版本

（免费源码）计算机毕业设计必看必学 springboot小说在线阅读系统82630-原创定制程序 java、PHP、python、小程序、文案全套、毕设成品等

Partytown调研说明

13个程序员常用开发工具用途推荐整理

;