(Photo by Anthony Metcalfe on Unsplash)
前段时间看到jmportilla这篇Kaggle Titanic Challenge文章时,我把它实现了出来。
目前处于学习阶段,只能通过大量动手实践,才能提升水平,免不了模仿别人。看着人家做出来的东西感觉很轻松,自己亲自动手做一遍才知道其实不容易。原文中注释都使用英文来写,很多地方不大好理解,本文添加了很多翻译,可能更容易理解一些。亲自动手做一遍,能够体会到Python数据分析的乐趣,也是促使你继续学习下去的动力。
数据准备
需要到Kaggle官网下载泰坦尼克沉船数据。(需翻墙)
环境准备
macOS 10.11.6 + Anaconda Navigator 1.2.1 + Python 2.7.12
主要用到的是Python数据分析那一套包,只要安装Anaconda,那些包就自动全部包括在内。其次是安装Seaborn进行图形输出处理。
执行结果
用Anaconda里面Jupyter Notebook一步步写完整个过程后,将得到的Titanic.ipynb文件使用Jupyter NBViewer进行转换,得到泰坦尼克沉船数据这个链接,观看更加直观。