百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Pandas 常用函数

haoteby 2025-05-24 14:20 29 浏览



Pandas 提供了大量用于数据处理和分析的函数,以下是一些常用的函数:

通用函数

函数

描述

pd.isna(obj)

检查对象是否为缺失值(NaN 或 None)。

pd.notna(obj)

检查对象是否不为缺失值。

pd.isnull(obj)

同 pd.isna(),检查对象是否为缺失值。

pd.notnull(obj)

同 pd.notna(),检查对象是否不为缺失值。

pd.concat(objs, axis)

沿指定轴连接多个对象(如 Series 或 DataFrame)。

pd.merge(left, right, on)

根据指定列合并两个 DataFrame。

pd.get_dummies(data)

将分类变量转换为哑变量(One-Hot 编码)。

pd.cut(x, bins)

将连续数据分箱为离散区间。

pd.qcut(x, q)

将数据按分位数分箱。

pd.to_numeric(arg)

将参数转换为数值类型。

pd.to_datetime(arg)

将参数转换为日期时间类型。

pd.to_timedelta(arg)

将参数转换为时间差类型。

pd.date_range(start, end)

生成日期范围。

pd.period_range(start, end)

生成周期范围。

pd.timedelta_range(start, end)

生成时间差范围。

pd.unique(values)

返回数组中的唯一值。

pd.value_counts(values)

返回数组中每个值的频率。

pd.factorize(values)

将数组编码为枚举类型。

pd.crosstab(index, columns)

计算交叉表。

pd.pivot_table(data, values, index, columns)

创建透视表。

pd.melt(frame)

将宽格式数据转换为长格式数据。

pd.cut(x, bins)

将连续数据分箱为离散区间。

pd.qcut(x, q)

将数据按分位数分箱。


数学和统计函数

函数

描述

pd.Series.sum()

返回 Series 的和。

pd.Series.mean()

返回 Series 的平均值。

pd.Series.median()

返回 Series 的中位数。

pd.Series.min()

返回 Series 的最小值。

pd.Series.max()

返回 Series 的最大值。

pd.Series.std()

返回 Series 的标准差。

pd.Series.var()

返回 Series 的方差。

pd.Series.corr(other)

返回两个 Series 的相关系数。

pd.Series.cov(other)

返回两个 Series 的协方差。

pd.Series.quantile(q)

返回 Series 的分位数。

pd.Series.mode()

返回 Series 的众数。

pd.Series.skew()

返回 Series 的偏度。

pd.Series.kurt()

返回 Series 的峰度。

pd.Series.cumsum()

返回 Series 的累计和。

pd.Series.cumprod()

返回 Series 的累计积。

pd.Series.cummax()

返回 Series 的累计最大值。

pd.Series.cummin()

返回 Series 的累计最小值。


字符串处理函数

函数

描述

pd.Series.str.lower()

将字符串转换为小写。

pd.Series.str.upper()

将字符串转换为大写。

pd.Series.str.strip()

去除字符串两端的空白字符。

pd.Series.str.replace(old, new)

替换字符串中的子串。

pd.Series.str.contains(pattern)

检查字符串是否包含指定模式。

pd.Series.str.split(sep)

按分隔符拆分字符串。

pd.Series.str.cat(others)

连接字符串。

pd.Series.str.extract(regex)

使用正则表达式提取子串。

pd.Series.str.find(sub)

返回子串的起始位置。

pd.Series.str.len()

返回字符串的长度。


时间序列函数

函数

描述

pd.to_datetime(arg)

将参数转换为日期时间类型。

pd.date_range(start, end)

生成日期范围。

pd.Timestamp()

创建一个时间戳对象。

pd.Timedelta()

创建一个时间差对象。

pd.Period()

创建一个周期对象。

pd.Series.dt.year

返回日期时间的年份。

pd.Series.dt.month

返回日期时间的月份。

pd.Series.dt.day

返回日期时间的天数。

pd.Series.dt.hour

返回日期时间的小时数。

pd.Series.dt.minute

返回日期时间的分钟数。

pd.Series.dt.second

返回日期时间的秒数。

pd.Series.dt.weekday

返回日期时间的星期几(0-6)。


实例

import pandas as pd

# 通用函数
s
= pd.Series([1, 2, 3, None])
print(pd.isna(s)) # 检查缺失值

# 数学和统计函数
print(s.sum()) # 计算和



# 字符串处理函数
s_str
= pd.Series(['a', 'b', 'c'])
print(s_str.str.upper()) # 转换为大写

# 时间序列函数
dates
= pd.to_datetime(['2023-01-01', '2023-02-01'])
print(dates.dt.month) # 提取月份



相关推荐

统统都能轻松装下。_如何安装统赢

今天必须来好好聊聊迈腾甄选款的外观升级优势,简直是把经典与时尚玩明白了!迈腾甄选款巧妙地保留了迈腾的经典气场和造型,就像一位历经岁月沉淀却风采依旧的绅士。2871mm的超长轴距搭配超短前后悬设计,这就...

麒麟操作系统常见问题:打开火狐浏览器提示没有安装flash插件

关键词:火狐浏览器、flash、插件、安装问题类型:...

VS Code 新手必装插件清单_vs code 安装插件

以下是针对VSCode新手的必装插件清单,覆盖代码编辑、效率提升、美化等核心需求,适用于大多数开发场景:一、基础必备插件Chinese(Simplified)(简体中文)功能:将VSC...

开源JSON可视神器,让阅读JSON变得简单!-JSONHero

众所周知,现在有不少代码编辑器以及在线工具,都支持JSON格式化,因此这一特性,已经不能称的上是亮点。调试工具已经成为每个开发者不可或缺的“利器”。但是,你见过能直接可视化JSON数据,把整个...

在NAS上部署Barcode服务_nas basic

部署基于BWIP-JS的条形码生成APIBWIP-JS是一个优秀的JavaScript条形码生成库,它支持多种条形码类型,并且可以运行在Node.js环境下,非常适合用来构建API服务。...

详细介绍一下Python如何对JSON格式数据进行处理?

在Python中对于JSON数据的处理是在日常开发中的常见需求之一。通常情况下,对JSON数据的处理主要涉及到如下的的几个步骤对于JSON数据的解析操作对于JSON数据的处理操作对于JSON数据的格式...

golang2021数据格式(69)Go语言将结构体数据保存为JSON格式数据

JSON格式是一种对象文本格式,是当前互联网最常用的信息交换格式之一。在Go语言中,可以使用json.Marshal()函数将结构体格式的数据格式化为JSON格式。想要使用json...

一个vsCode格式化插件_vscode 格式化文档

ESlint...

自己抓取家中IPTV组播地址,不用交换机或多网卡,远程抓取更方便

通过IPTV播放应用在电视、电脑或者手机观看家中的IPTV电视直播,可以摆脱IPTV机顶盒的限制,方便在家中多台电视或者手机电脑上观看IPTV电视直播。运营商IPTV的电视直播信号稳定、高清,和互联网...

扣子免费系列教程, 如何使用扣子(coze)对接飞书多维表格?

一、说明大家都知道使用扣子(coze)把一些文本内容转为小红书风格很方便。但每次都是复制粘贴。很麻烦那能不能批量呢?今天我们就来学习下,使用扣子(coze)平台完成内容的批量转换。基本思路是读取飞书多...

1024程序员节 花了三个小时调试 集合近50种常用小工具 开源项目

开篇1024是程序员节了,本来我说看个开源项目花半个小时调试之前看的一个不错的开源项目,一个日常开发常常使用的工具集,结果花了我三个小时,开源作者的开源项目中缺少一些文件,我一个个在网上找的,好多坑...

办公人必看!3分钟搞定JSON/XML/Markdown,格式转换竟如此简单!

你是不是也遇到过这些情况:领导突然甩来一份密密麻麻的数据文件,要你半小时内整理成报表;想写技术文档,却被Markdown的语法搞得头大;或者同事发来的JSON文件,打开全是“{”“}”“,”,看得眼花...

开发者必备!zerotools.top全栈效率神器

强烈建议开发者们收藏https://zerotools.top,用它来提升日常效率。一、功能覆盖:从数据到图像的全栈支持Zerotools.top的最大亮点,是其功能维度的完整性。根据最新页面...

15 个非常好用的 JSON 工具_json tools

JSON(JavaScriptObjectNotation)是一种流行的数据交换格式,已经成为许多应用程序中常用的标准。无论您是开发Web应用程序,构建API,还是处理数据,使用JSON工具可以大...

C#.NET Newtonsoft.Json 详解_c# jsonresult

简介Newtonsoft.Json(又称...