Belajar Index Objects Pandas Lengkap pada Python: Tutorial dan Contoh Penggunaan

Artikel berikut memuat Belajar Index Objects Pandas Lengkap pada Python: Tutorial dan Contoh Penggunaan
Belajar Index Objects Pandas Lengkap pada Python: Tutorial dan Contoh Penggunaan

1. Pengertian

Pandas adalah salah satu library Python yang digunakan untuk melakukan analisis data. Salah satu komponen utama dari Pandas adalah DataFrame, yaitu sebuah struktur data yang terdiri dari kolom dan baris. Setiap kolom pada DataFrame dapat memiliki tipe data yang berbeda-beda. Pandas memiliki Index Objects, yaitu sebuah struktur data yang digunakan untuk mengidentifikasi setiap baris pada DataFrame.

Index Objects dapat dibuat dari berbagai tipe data, seperti integer, string, datetime, dan lain-lain. Index Objects memiliki banyak fungsi yang sangat berguna dalam melakukan analisis data, seperti indexing, selection, reindexing, dan lain-lain.

2. Jenis-jenis Index Objects

Pandas memiliki beberapa jenis Index Objects, di antaranya adalah:

  1. Numeric Index
  2. String Index
  3. Datetime Index
  4. Period Index
  5. MultiIndex
  6. Categorical Index

Numeric Index

Numeric Index adalah Index Objects yang terdiri dari bilangan bulat atau bilangan desimal. Numeric Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh bilangan bulat atau bilangan desimal.

String Index

String Index adalah Index Objects yang terdiri dari karakter atau string. String Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh karakter atau string.

Datetime Index

Datetime Index adalah Index Objects yang terdiri dari tanggal dan waktu. Datetime Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh tanggal dan waktu.

Period Index

Period Index adalah Index Objects yang terdiri dari periode waktu. Periode waktu dapat berupa hari, minggu, bulan, atau tahun. Period Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh periode waktu.

MultiIndex

MultiIndex adalah Index Objects yang terdiri dari beberapa tingkat atau hierarki. MultiIndex digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh beberapa tingkat atau hierarki.

3. Contoh Penggunaan

Numeric Index

Contoh penggunaan Numeric Index:

import pandas as pd

data = {'Name': ['John', 'Emily', 'Charlie', 'Susan'],
        'Age': [30, 25, 35, 28],
        'Salary': [50000, 60000, 55000, 65000]}

df = pd.DataFrame(data, index=[1, 2, 3, 4])

print(df)

output

      Name  Age  Salary
1     John   30   50000
2    Emily   25   60000
3  Charlie   35   55000
4    Susan   28   65000

Pada contoh di atas, Numeric Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index 1, baris kedua memiliki index 2, dan seterusnya.

String Index

Contoh penggunaan String Index:

import pandas as pd

data = {'Name': ['John', 'Emily', 'Charlie', 'Susan'],
        'Age': [30, 25, 35, 28],
        'Salary': [50000, 60000, 55000, 65000]}

df = pd.DataFrame(data, index=['a', 'b', 'c', 'd'])

print(df)

Output

      Name  Age  Salary
a     John   30   50000
b    Emily   25   60000
c  Charlie   35   55000
d    Susan   28   65000

Pada contoh di atas, String Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index 'a', baris kedua memiliki index 'b', dan seterusnya.

Datetime Index

Contoh penggunaan Datetime Index:

import pandas as pd

data = {'Temperature': [25, 27, 26, 24],
        'Humidity': [60, 65, 70, 75]}

date_range = pd.date_range('2022-01-01', periods=4)

df = pd.DataFrame(data, index=date_range)

print(df)

Output

            Temperature  Humidity
2022-01-01           25        60
2022-01-02           27        65
2022-01-03           26        70
2022-01-04           24        75

Pada contoh di atas, Datetime Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index '2022-01-01', baris kedua memiliki index '2022-01-02', dan seterusnya.

Period Index

Contoh penggunaan Period Index:

import pandas as pd

data = {'Sales': [1000, 2000, 1500, 3000],
        'Expenses': [800, 1200, 1000, 1500]}

date_range = pd.period_range('2022-01', periods=4, freq='M')

df = pd.DataFrame(data, index=date_range)

print(df)

Output

         Sales  Expenses
2022-01   1000       800
2022-02   2000      1200
2022-03   1500      1000
2022-04   3000      1500

Pada contoh di atas, Period Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index '2022-01', baris kedua memiliki index '2022-02', dan seterusnya.

4. Kesimpulan

Index Objects pada pandas adalah salah satu fitur penting yang memungkinkan kita untuk memberikan label pada setiap baris atau kolom pada DataFrame. Terdapat beberapa tipe Index Objects yang bisa digunakan, yaitu Numeric Index, String Index, Datetime Index, dan Period Index. Setiap tipe Index Objects memiliki kegunaan dan cara penggunaan yang berbeda-beda. Penggunaan Index Objects yang tepat akan memudahkan kita dalam melakukan manipulasi data pada DataFrame.