Pandas练习题-提高你的数据分析技能

讨论 hello2060
Lv2 初级炼丹师
发布在 Pandas   2050   0
讨论 hello2060   2050   0

    本文总结了pandas的常用操作,并做成练习题,练习题附答案,并且有完整数据集,建议读者把练习题完成。作者认为,做完练习题,pandas的基本操作没有问题了,以后碰到问题也可以查这些习题。(文末提供下载)

    Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
    网上可以搜到大量的pandas教程和官方文档,但没有简单的方法来练习。教程是很好的资源,但要付诸实践。 只有实践,才能更好的加深学习。
    本站从github搜索到了一些pandas的练习题,含完整数据集,并进行整理:
    原代码作者:Guilherme Samora

    本练习代码可以在github下载:
    https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises

    Pandas练习题目录
    1.Getting and knowing

    • Chipotle
    • Occupation
    • World Food Facts

    2.Filtering and Sorting

    • Chipotle
    • Euro12
    • Fictional Army

    3.Grouping

    • Alcohol Consumption
    • Occupation
    • Regiment

    4.Apply

    • Students
    • Alcohol Consumption
    • US_Crime_Rates

    5.Merge

    • Auto_MPG
    • Fictitious Names
    • House Market

    6.Stats

    • US_Baby_Names
    • Wind_Stats

    7.Visualization

    • Chipotle
    • Titanic Disaster
    • Scores
    • Online Retail
    • Tips

    8.Creating Series and DataFrames

    • Pokemon

    9.Time Series

    • Apple_Stock
    • Getting_Financial_Data
    • Investor_Flow_of_Funds_US

    10.Deleting

    • Iris
    • Wine


    使用方法
    每个练习文件夹有三个不同类型的文件:
    1. Exercises.ipynb

    没有答案代码的文件,这个是你做的练习
    2.Solutions.ipynb
    运行代码后的结果(不要改动)
    3.Exercise_with_Solutions.ipynb
    有答案代码和注释的文件
    你可以在Exercises.ipynb里输入代码,看看运行结果是否和Solutions.ipynb里面的内容一致,如果真的完成不了再看下Exercise_with_Solutions.ipynb的答案。

    典型的例题如图所示:


    总结
    本文把pandas的常用操作做成练习题,练习题附答案,并且有完整数据集。希望初学者能认真完成练习题,以便提高数据分析技能。
    本练习代码可以在github下载:
    https://github.com/fengdu78/machine_learning_beginner/tree/master/pandas/Pandas_Exercises

    参考

    guipsamora/pandas_exercises

    版权声明:作者保留权利,不代表意本站立场。如需转载请联系本站以及作者。

    参与讨论

    回复《 Pandas练习题-提高你的数据分析技能

    EditorJs 编辑器

    沙发,很寂寞~
    反馈
    to-top--btn