如何处理 Pandas 中的空值?

2020-12-23 17:26:32 +08:00
 fanqieipnet
如何处理 Pandas 中的空值?今天番茄加速就来跟大家探讨一下。

  只要和数据打交道,就不可能不面对一个令人头疼的问题-数据集中存在空值。空值处理,是数据预处理之数据清洗的重要内容之一。

   Python 数据分析包 Pandas 提供了一些便利的函数,可以帮助我们快速按照设想处理、解决空值。

  空值处理的第一招:快速确认数据集中是不是存在空值。有两个函数 isnull, notnull,可以帮助我们快速定位数据集中每个元素是否为空值。

  说到空值,在 NumPy 中定义为:np.nan ,Python 中定义为 None,所以大家注意这种表达方式。这里面有一个坑,就是 Pandas 对象某列或某行,直接拿 np.nan , None 判断元素是否为空,发现返回的都是 False 。注意:这样做是不可取的!

  第二招,假设存在空值,可以使用 Pandas 中的 fillna 函数填充空值,fillna 有一个关键参数:method, 当设置 method 为 pad 时,表示怎样填充呢? 从上一个有效数据传播到下一个有效数据行。此外,还有一个限制连续空值行的数量的关键字 limit.

  第三招,检测到了空值数据,但是不想做任何填充,而是仅仅想丢弃这些空值数据,Pandas 提供了 dropna 函数做这件事情。里面有两个关键参数:axis, how, 例如组合:axis = 0,how =\'any\',表示某行只要某个元素为空值,就丢弃。

  以上就是 Pandas 中,空值处理的基本思路。
707 次点击
所在节点    推广
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/738321

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX