Python使用Pandas读取Excel指定的列

Pandas的read_excel可以指定读取的列:

import pandas as pd
import numpy as np
file_loc = "path.xlsx"
df = pd.read_excel(file_loc, index_col=None, na_values=['NA'], parse_cols = "A,C:AA")
print(df)

parse_cols的值可以是:int,list,string和None,默认为None。

  • None:如果为None则读取excel所有的列
  • int:整数表示读取最后几列
  • list:如果是一个整数列表,那么就是指定的序号的列会被读取
  • string:按列名读取,如“A:E” or “A,C,E:F”

详情参考:http://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.read_excel.html

版权声明:著作权归作者所有。

相关推荐

一些有用的pandas代码片段

# 列出dataframe指定列的唯一值 df['Column Name'].unique() # 把列的数据类型转换为数字。如果有非数字值,则会出错。 pd.to_numeric(df['Column Name']) # 把列的数据类型转换为数字,如果非数字值,则会转换为NaN pd.to_numeric(df['Column Na

Pandas对应SQL的in和not in实现

在Pandas提供了pd.isin(),使用它可以实现SQL的in和not in。not in 对应于:~a.isin(b) 示例:假如有以下dataframe数据,它包含了列data如下:>>> df   data 0   a 1   b 2 &nb

Python 3按指定的元素分割列表

Python 3有多种方法可以用来分割列表。示例有以下列表li = ['a','b','c','.','aa','bb','cc','.','aaa','bbb','ccc'] 现需要按“.”分割列表。使用itertools.groupby>>>li = ['a','b','c','.','aa','bb','cc','.','a

Java随机产生指定范围的int整数

Java 7后的版本Java 7新增了ThreadLocalRandom类,可以使用它来随机生成指定范围的整数。import java.util.concurrent.ThreadLocalRandom; int randomNum = ThreadLocalRandom.current().nextInt(min, max);