博客目录与概览

从即日起,我将开始开始着手写作《深入理解机器学习》分类下的文章。《深入理解机器学习》不仅仅把目光局限机器学习算法的推导与实现,更多的会将目光聚焦于从数学、统计学以及统计学习的角度来深入理解机器学习算法,除此之外,我还会讨论各个机器学习算法局限与瓶颈,纵横向比较各种机器学习算法的优劣等。在详细介绍机器学习算法的同时,我还会通过Python和Scala给出相关项目的实战代码。所以,想深入学习机器学习的…

大家好,又见面了,我是你们的朋友全栈君。

本博客主要聚焦于人工智能(Artificial Intelligence)领域,包括机器学习(Machine Learning)算法和深度学习(Deep Learning)算法以及其在具体项目中的实现,如:计算机视觉、自然语言处理、推荐系统等。除此之外,本博客还兼顾算法学(Algorithmics)、大数据(Big Data)、数据科学(Data Science)、商业智能(Business Intelligence)等方向的知识,冀希读者能能通过阅读本博客的文章,构建完整的知识体系与框架。

人工智能(Artificial Intelligence)领域:

深入理解机器学习》系列和《深入理解深度学习》系列主要介绍了机器学习算法和深度学习算法的推导过程与实现方法,而《机器学习中的数学》系列详细介绍了在机器学习和深度学习理论中所必要的数学知识,如线性代数、概率论、信息论、数理统计、解析几何、最优化理论等。另外在代码实现层面,《机器学习项目实战》基于Python3的scikit-learnxgboostlightgbmapyori等模块和公开的真实数据集介绍了真实项目的构建步骤,《TensorFlow2代码入门到项目实战》则以Google最新的TensorFlow2.X模块讲解了当今业界在深度学习各项目中的实践方法。另外,《深入浅出TensorFlow2函数》则以TensorFlow2.X模块的函数为粒度介绍了各个函数的使用方法、参数、返回值、实现过程等信息。

算法学(Algorithmics)领域:

在《算法设计与分析》系列中,我们主要介绍算法学基础的相关知识,这部分的内容基本是算法工程师必备的技能。当今算法工程师有很多种,如:音/视频算法工程师、图像处理算法工程师、计算机视觉算法工程师、自然语言算法工程师、数据挖掘算法工程师、搜索算法工程师、通信基带算法工程师、信号算法工程师、射频/通信算法工程师、控制算法工程师、导航算法工程师等,本系列的内容都是算法工程师必备的知识。

大数据(Big Data)和数据科学(Data Science)领域

数据科学家之路》聚焦于数据分析领域,介绍了除机器学习算法以外的数据科学相关技术。在数据获取层面,《Python爬虫从入门到精通》系列详细介绍了基于Python3的爬虫技术与方法。在大数据方面,《大数据与云计算》系列介绍了Hadoop及其生态如Spark、Kylin等的相关知识。

商业智能(Business Intelligence)领域

商业智能》系列以完整的商业智能解决方案为导向,涉及维度建模、数据仓库等知识,与其它系列文章互补,构建了从数据模型到具体业务的知识体系。

其它专栏

本博客还对人工智能领域常用编程语言Python(《系统学习Python》系列)、Scala(《快速入门Scala》系列)和SQL(《快速入门SQL》系列)做了介绍与解读。除此之外,针对本人平时读的书籍与文献创作了专栏《读书笔记与读后感》。

各分类的目录与介绍如下,我会根据实际情况逐渐完善各个分类下的内容。


深入理解机器学习

《深入理解机器学习》系列不仅仅把目光局限机器学习算法的推导与实现,还会从数学、统计学以及统计学习的角度来深入理解机器学习算法,除此之外,本系列还会讨论各个机器学习算法局限与瓶颈,纵横向比较各种机器学习算法的优劣等。另外,在详细介绍机器学习算法的同时,我还会通过Python以及相关机器学习模块如scikit-learnapyori等给出相关项目的实战代码。希望读者能通过阅读本系列的文章对机器学习算法相关的知识有一定深度的理解。

  • 机器学习概览
  • 线性回归(Linear Regression)
  • 广义线性模型(Generalize Linear Model)
  • 逻辑斯蒂回归(Logistic Regression)
  • k-近邻算法(kNN,k-Nearest Neighbor)
  • 决策树(Decision Tree)
    • 基于树的模型(一):分类树与回归树
    • 基于树的模型(二):集成学习之Bagging和Random Forest
    • 基于树的模型(三):集成学习之GBDT和XGBoost
    • 基于树的模型(四):随机森林的延伸——深度森林(gcForest)
    • 基于树的模型(五):从零开始用Python实现ID3决策树
    • 基于树的模型(六):Python实现CART决策树并利用Tkinter构建GUI对决策树进行调优
  • 朴素贝叶斯(Naive Bayes)
  • EM算法(Expectation Maximization Algorithm)
  • 最大熵模型(Maximum Entropy Model)
  • 支持向量机(Support Vector Machine)
  • 聚类(Clustering)
  • 概率图模型(PGM,Probabilistic Graphical Model)
    • 隐马尔科夫模型(HMM,Hidden Markov Model)
    • 马尔可夫随机场(Markov Random Field)
    • 条件随机场(Conditional Random Fields)
  • 马尔可夫链蒙特卡罗方法(MCMC,Markov Chain Monte Carlo)

深入理解深度学习

《深入理解深度学习》系列以机器学习中的神经网络算法为主线,由浅入深地介绍各类型的神经网络结构与应用场景以及深度学习理论中必备的知识点。除此之外,该分类在介绍完算法后,还会用基于TensorFlow2.0的Python3代码来实现相关算法。在该分类的最后,还会涉及科学家们正在研究的前沿课题与领域,供大家学习与参考。


机器学习中的数学

《机器学习中的数学》系列详细介绍了在机器学习理论中所必要的数学知识,如线性代数、概率论、信息论、数理统计、解析几何、最优化理论等。本章仅介绍机器学习及深度学习理论中必要的数学知识,对其整体的框架逻辑没有做详尽的解读,读者若想系统的学习完整的高等数学方面的知识,可以另找相关教材。在讲授相关知识的同时,该系列还会以Python3为基础,通过引入pandasnumpytensorflow等模块来展示相关的数学知识。

线性代数

概率论与数理统计

数值分析

最优化理论


深入浅出TensorFlow2函数

《深入浅出TensorFlow2函数》系列以TensorFlow2.X模块的函数为粒度介绍了各个函数的使用方法、参数、返回值、实现过程等信息。每篇文章为一个函数,首先会介绍函数的表现形式以及其意义、使用时的注意事项等信息。其次,会给出函数的参数和返回值。最后,会列出函数的实现过程,这一部分的内容有利于读者深入浅出的理解TensorFlow2.X模块的函数。


算法设计与分析

《算法设计与分析》以算法设计为核心,详细系统地介绍了数据结构和算法学的相关理论。在需要代码实践的部分,本系列使用了伪代码或Python代码实现,有兴趣的读者还可以自行选用自己喜爱的语言实现该过程。


数据科学家之路

《数据科学家之路》系列以数据科学为主线,重点阐述数据科学领域中算法以外的知识点,读者通过阅读本系列文章和算法相关的系列文章就可以构建完整的数据科学知识体系。


商业智能

《商业智能》系列以完整的商业智能解决方案为导向,涉及维度建模、数据仓库以及Tableau数据可视化等方面的知识。该系列与其它系列文章互补,构建了从数据模型到具体业务的BI/DW知识体系,本系列又分为《维度建模》、《数据仓库Hive编程》等子系列。

维度建模

数据仓库Hive编程

Tableau数据可视化

  • Tableau数据可视化概述

大数据与云计算

《大数据与云计算》系列以人工智能的应用为基础,介绍大数据与云计算的相关知识。该系列以Hadoop生态为基础,介绍了与人工智能领域、商业智能领域强相关的一些Hadoop生态内的工具。


Python爬虫从入门到精通

《Python爬虫从入门到精通》系列以一个仅会Python基础的程序员的角度深入讲解了Python爬虫理论及实战。数据作为数据科学领域的基石具有十分重要的意义,而爬虫作为数据获取中一个重要的手段值得各位希望从事数据科学领域的朋友们学习理解。


系统学习Python

《系统学习Python》系列将深入浅出地介绍Python语言的各个特性。无论您对Python毫无基础还是有几年Python编程经验,本分类的文章都会非常适合您。在本分类下,我还会适当的标出Python高级特性的部分,如果您是初学者,可以跳过该部分的学习。除此之外,我还会介绍Python的一些编程技巧以及Python编程中的一些易错点。
高级数据结构


快速入门Scala

《快速入门Scala》系列面向零基础的读者。博主希望零基础的读者能通过阅读该分类下的文章能够快速入门Scala,对Scala语法有一个基本的认识,能读懂代码并上手Scala的小项目。Scala作为Spark的底层语言越发越受到重视,在使用Spark处理大数据时,相比于Java与Python,Scala得天独厚的优势即将显现。


读书笔记与读后感

《读书笔记与读后感》系列为本人日常阅读的书籍或文献所做的书摘与感悟,其不仅涉及了与上述技术相关的书籍,还涉及了数学、物理学、经济学、传记等书籍或文献,有些书籍和文献可能仅为本人业余消遣所读,而其余的也可能与人工智能与大数据技术存在着千丝万缕的联系。


本博客主要参考的书籍:
[1] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015.
[2] Aston Zhang, Zack C. Lipton, Mu Li, Alex J. Smola. Dive Into Deep Learning[J]. arXiv preprint arXiv:2106.11342, 2021.
[3] James G , D Witten, Hastie T , et al. An Introduction to Statistical Learning: With Applications in R[M]. 2013.
[4] ThomasH.Cormen, Cormen, Leiserson,等. 算法导论[M]. 机械工业出版社, 2006.
[5] 周志华. 机器学习[J]. 清华大学出版社, 2016.
[6] 崔庆才. Python 3网络爬虫开发实战[M]. 人民邮电出版社, 2018
[7] 吴茂贵, 王红星. 深入浅出Embedding:原理解析与应用实战[M]. 机械工业出版社, 2021
[8] 王喆. 深度学习推荐系统[M]. 电子工业出版社, 2020

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/125926.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号