Belajar Index Objects Pandas Lengkap pada Python: Tutorial dan Contoh Penggunaan
1. Pengertian
Pandas adalah salah satu library Python yang digunakan untuk melakukan analisis data. Salah satu komponen utama dari Pandas adalah DataFrame, yaitu sebuah struktur data yang terdiri dari kolom dan baris. Setiap kolom pada DataFrame dapat memiliki tipe data yang berbeda-beda. Pandas memiliki Index Objects, yaitu sebuah struktur data yang digunakan untuk mengidentifikasi setiap baris pada DataFrame.
Index Objects dapat dibuat dari berbagai tipe data, seperti integer, string, datetime, dan lain-lain. Index Objects memiliki banyak fungsi yang sangat berguna dalam melakukan analisis data, seperti indexing, selection, reindexing, dan lain-lain.
2. Jenis-jenis Index Objects
Pandas memiliki beberapa jenis Index Objects, di antaranya adalah:
- Numeric Index
- String Index
- Datetime Index
- Period Index
- MultiIndex
- Categorical Index
Numeric Index
Numeric Index adalah Index Objects yang terdiri dari bilangan bulat atau bilangan desimal. Numeric Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh bilangan bulat atau bilangan desimal.
String Index
String Index adalah Index Objects yang terdiri dari karakter atau string. String Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh karakter atau string.
Datetime Index
Datetime Index adalah Index Objects yang terdiri dari tanggal dan waktu. Datetime Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh tanggal dan waktu.
Period Index
Period Index adalah Index Objects yang terdiri dari periode waktu. Periode waktu dapat berupa hari, minggu, bulan, atau tahun. Period Index digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh periode waktu.
MultiIndex
MultiIndex adalah Index Objects yang terdiri dari beberapa tingkat atau hierarki. MultiIndex digunakan ketika baris pada DataFrame memiliki identitas yang dapat diwakili oleh beberapa tingkat atau hierarki.
3. Contoh Penggunaan
Numeric Index
Contoh penggunaan Numeric Index:
import pandas as pd
data = {'Name': ['John', 'Emily', 'Charlie', 'Susan'],
'Age': [30, 25, 35, 28],
'Salary': [50000, 60000, 55000, 65000]}
df = pd.DataFrame(data, index=[1, 2, 3, 4])
print(df)
output
Name Age Salary
1 John 30 50000
2 Emily 25 60000
3 Charlie 35 55000
4 Susan 28 65000
Pada contoh di atas, Numeric Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index 1, baris kedua memiliki index 2, dan seterusnya.
String Index
Contoh penggunaan String Index:
import pandas as pd
data = {'Name': ['John', 'Emily', 'Charlie', 'Susan'],
'Age': [30, 25, 35, 28],
'Salary': [50000, 60000, 55000, 65000]}
df = pd.DataFrame(data, index=['a', 'b', 'c', 'd'])
print(df)
Output
Name Age Salary
a John 30 50000
b Emily 25 60000
c Charlie 35 55000
d Susan 28 65000
Pada contoh di atas, String Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index 'a', baris kedua memiliki index 'b', dan seterusnya.
Datetime Index
Contoh penggunaan Datetime Index:
import pandas as pd
data = {'Temperature': [25, 27, 26, 24],
'Humidity': [60, 65, 70, 75]}
date_range = pd.date_range('2022-01-01', periods=4)
df = pd.DataFrame(data, index=date_range)
print(df)
Output
Temperature Humidity
2022-01-01 25 60
2022-01-02 27 65
2022-01-03 26 70
2022-01-04 24 75
Pada contoh di atas, Datetime Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index '2022-01-01', baris kedua memiliki index '2022-01-02', dan seterusnya.
Period Index
Contoh penggunaan Period Index:
import pandas as pd
data = {'Sales': [1000, 2000, 1500, 3000],
'Expenses': [800, 1200, 1000, 1500]}
date_range = pd.period_range('2022-01', periods=4, freq='M')
df = pd.DataFrame(data, index=date_range)
print(df)
Output
Sales Expenses
2022-01 1000 800
2022-02 2000 1200
2022-03 1500 1000
2022-04 3000 1500
Pada contoh di atas, Period Index digunakan untuk mengidentifikasi setiap baris pada DataFrame. Baris pertama memiliki index '2022-01', baris kedua memiliki index '2022-02', dan seterusnya.
4. Kesimpulan
Index Objects pada pandas adalah salah satu fitur penting yang memungkinkan kita untuk memberikan label pada setiap baris atau kolom pada DataFrame. Terdapat beberapa tipe Index Objects yang bisa digunakan, yaitu Numeric Index, String Index, Datetime Index, dan Period Index. Setiap tipe Index Objects memiliki kegunaan dan cara penggunaan yang berbeda-beda. Penggunaan Index Objects yang tepat akan memudahkan kita dalam melakukan manipulasi data pada DataFrame.
Gabung dalam percakapan