【Pandas】Excelファイルの読み込み方法まとめ

pandas_Excelファイルの読み込み

困っている人

  • PandasのDataFrame(データフレーム )ってなに?
  • PandasのExcelファイルの読み込み方法を知りたい
  • Excelの応用的な読み込み方法を教えてほしい

 

この記事で解決できること
  1. PandasのDataFrameが「どういうものか」分かる
  2. PandasにExcelファイルを読み込む方法が分かる
  3. Excelの応用的な読み込み方法が分かる

 

DataFrame(データフレーム) とは?

DataFrame(データフレーム)とは、”Excel”や”Spreadsheet”のような表形式(2次元)で情報を管理するデータ構造のことです

データ分析用のライブラリであるPandasを使って、Excelファイル・csvファイルからDataFrame形式にデータを変換することで様々な操作が可能です。

PandasのDataFrameでは、大量のデータを高速かつ効率的に処理できるという大きなメリットがあります。データ分析や業務効率化には欠かせない仕組みです。

 

Excelファイルのシート名を指定した読み込み

Excelファイルの読み込みに必要な「Pandas」をインポートします。

pandas_Excelファイルの読み込み

  1. pandasのインポート
  2. データフレーム (fruits_df)へExcelファイルの読み込み
  3. データフレーム (fruits_df)を表示

 

Excelファイルの読み込み(列名なし)

Excelファイルに列名がない場合、自動的に最初の行が列名に指定されます。

pandas_Excelファイルの読み込み

”header=None”を指定することで、列名なしで読み込むことができます。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df1)へ、列名なしでExcelファイルの読み込み
  2. データフレーム (fruits_df1)を表示

 

Excelファイルの読み込み(列名を指定)

Excelファイルを読み込む時に、列名(”商品名”、”単価”、”産地”)を指定することができます。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df1)へ、列名を指定してExcelファイルの読み込み
  2. データフレーム (fruits_df1)を表示

 

Excelファイルの読み込み(データ型を指定)_全て

データ方を指定しない場合、商品コードが数値に自動的に変換(001→1、002→2、003→3)されてしまいます。

pandas_Excelファイルの読み込み

データ型をExcelファイルの列の指定のデータ型(object型)を指定して読み込みできます。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df4)へ、object型を指定してExcelファイルの読み込み
  2. データフレーム (fruits_df4)を表示

全てobject型で読み込みできています。

pandas_Excelファイルの読み込み

 

Excelファイルの読み込み(データ型を指定)_列名単位

dtypeを列名単位で指定できます(商品コード→object型、単価→int型)。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df5)へ、object型を指定(列名単位)してExcelファイルの読み込み
  2. データフレーム (fruits_df5)を表示

単価のみint型で読み込みできています。

pandas_Excelファイルの読み込み

 

Excelファイルの列名を指定した読み込み

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df6)へ、列名を指定してExcelファイルの読み込み
  2. データフレーム (fruits_df6)を表示

 

Excelファイルのインデックスを指定した読み込み

インデックス番号の列が自動的に挿入されます。

pandas_Excelファイルの読み込み

商品コード(列名)をインデックスに指定して読み込みできます。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df7)へ、インデックスを商品コードに指定してExcelファイルの読み込み
  2. データフレーム (fruits_df7)を表示

 

Excelファイルの読み込む行数を指定した読み込み

読み込む行数(nrows=3)を指定できます。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df8)へ、読み込む行数を指定してExcelファイルの読み込み
  2. データフレーム (fruits_df8)を表示

 

Excelファイルの読み込む行をスキップした読み込み

指定の行をスキップして読み込みできます。

pandas_Excelファイルの読み込み

  1. データフレーム (fruits_df9)へ、スキップしたい行数を指定してExcelファイルの読み込み
  2. データフレーム (fruits_df9)を表示

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です