金融中的机器学习
上QQ阅读APP看书,第一时间看更新

本书内容概要

第1章“神经网络和基于梯度的优化”讨论机器学习包括哪些类别,以及在金融的不同细分领域中使用它们的背后动机。我们将学习神经网络的工作原理,并从头构建一个神经网络模型。

第2章“机器学习在结构化数据中的应用”处理诸如关系型数据库中具有固定字段的数据。我们将体验模型的创建过程:从一个启发式模型,到简单的基于特征工程的模型,再到完全基于学习的模型。另外,我们将学习如何使用scikit-learn来评估模型,如何训练基于树状的模型(如随机森林),以及如何使用Keras来构建神经网络模型。

第3章“计算机视觉的应用”讲述了计算机视觉让我们按照比例解释和观察现实世界的过程。在这一章中,我们将学习让计算机视觉识别图像内容的技术,还将学习卷积神经网络和Keras模块,并使用这些模块来设计和训练前沿的计算机视觉模型。

第4章“理解时间序列”讨论分析时间相关的数据所需的大部分工具。在这一章中,我们首先讨论产业界专业人士用于建模时间序列的精选工具,并讲述如何用Python高效地使用这些工具。我们将学习现代机器学习算法是如何在时间序列中挖掘各类模式的,并讨论如何通过传统技术来辅助补充现代机器学习技术。

第5章“用自然语言处理解析文本数据”讨论如何使用spaCy库和大量的新闻数据来让诸如命名实体识别和情感分析等常见任务可以快速高效地执行。我们将学习如何使用Keras库来创建定制化的语言模型。本章还介绍Keras函数式应用程序编程接口(Application Pragramming Interface,API),函数式API可以让我们构建更加复杂的模型(如不同语言之间的翻译模型)。

第6章“生成模型的应用”讲述了使用生成模型来生成数据。当我们没有充足的数据或希望通过模型观察数据并分析数据时,可以使用生成模型来生成数据。在这一章中,我们将学习(变分)自编码器和生成式对抗模型。我们将学习使用t-SNE算法来合理使用上述工具,使用它们来解决传统问题(如信用卡诈骗检测)。我们将通过机器学习来辅助人类的打标签操作,进而提高数据收集和打标签的效率。最后,使用主动学习来收集有用的数据并大大减少需要的数据量。

第7章“金融市场中的强化学习”讨论了强化学习。强化学习不需要人类打标签,可以“正确”地训练数据。本章讨论和实现几个强化学习算法,从Q-learning到A2C(Advantage Actor-Critic)算法。我们将讨论背后的理论、与经济领域的关联,并在实际的案例中了解强化学习如何直接用于挖掘组合的形成。

第8章“调试和发布产品”解决了在构建和出品复杂模型过程中可能遇到的各种问题。我们将讨论如何调试和测试数据,在训练模型过程中保持对数据隐私的敏感性,如何为训练准备数据,并且分析为什么模型会如此预测。我们将学习自动化调节模型超参,学习使用学习速率来减少过拟合,学习诊断和避免梯度消失和梯度爆炸问题。本章还解释了如何去监控和理解生产中的指标,并讨论如何提升建模速度。

第9章“挑战偏见”讨论了机器学习模型可能学习不公平的策略。本章强调了几种强化模型公平性的方法,包括中枢学习(pivot learning)和因果学习(causal learning)。本章展示如何检查模型和挖掘偏见。最后讨论模型所在的复杂系统中的不公平如何导致系统失败,并给出了检查清单来帮助模型减少偏见。

第10章“贝叶斯推理和概率编程”使用PyMC3来讨论使用概率编程的理论优势和实际优势。我们实现了一个采样器,来从数值角度理解贝叶斯理论,最后学习如何推断股票价格波动的分布。