Basic Pandas Operations: Membuat, Mengambil, Mengganti, dan Menghitung Statistik Data dengan Contoh
Artikel berikut memuat Basic Pandas Operations: Membuat, Mengambil, Mengganti, dan Menghitung Statistik Data dengan Contoh
Pendahuluan
Pandas adalah salah satu library Python yang paling populer dan berguna untuk mengolah data. Dalam Pandas, terdapat beberapa operasi dasar yang dapat dilakukan untuk memanipulasi data dengan mudah. Salah satu operasi dasar tersebut adalah menciptakan data atau membuat DataFrame dan Series.
Membuat DataFrame
DataFrame adalah struktur data tabular yang terdiri dari baris dan kolom, mirip dengan tabel database. Untuk membuat DataFrame kosong, Anda dapat menggunakan kode berikut:
import pandas as pd
df = pd.DataFrame()
Anda juga dapat membuat DataFrame dari sebuah dictionary, di mana setiap pasangan kunci-nilai dalam dictionary akan menjadi sebuah kolom dalam DataFrame. Contoh:
data = {'nama': ['Budi', 'Siti', 'Ani', 'Dedi'],
'umur': [21, 22, 23, 24],
'gender': ['L', 'P', 'P', 'L']}
df = pd.DataFrame(data)
Membuat Series
Series adalah struktur data satu dimensi yang mirip dengan array atau list. Namun, Series memiliki indeks, sehingga setiap elemen dalam Series dapat diakses menggunakan indeksnya. Untuk membuat Series kosong, Anda dapat menggunakan kode berikut:
import pandas as pd
s = pd.Series()
Anda juga dapat membuat Series dari sebuah list atau array. Contoh:
data = [10, 20, 30, 40, 50]
s = pd.Series(data)
Mengambil Data
Anda dapat mengambil data dari DataFrame atau Series menggunakan indeks atau label. Contoh:
# mengambil data dari kolom 'nama'
df['nama']
# mengambil data dari baris pertama
df.loc[0]
# mengambil data dari baris kedua dan kolom 'umur'
df.loc[1, 'umur']
# mengambil data dari indeks ke-2 hingga ke-4
s[2:5]
Menghapus Data
Anda dapat menghapus data dari DataFrame atau Series menggunakan fungsi drop(). Contoh:
# menghapus kolom 'gender' dari DataFrame
df = df.drop('gender', axis=1)
# menghapus baris pertama dari DataFrame
df = df.drop(0)
# menghapus elemen ke-3 dari Series
s = s.drop(2)
Mengganti Data
Anda dapat mengganti data dalam DataFrame atau Series menggunakan fungsi replace(). Contoh:
# mengganti nilai 'P' menjadi 'Perempuan' dalam kolom 'gender' dari DataFrame
df = df.replace('P', 'Perempuan')
# mengganti nilai 30 menjadi 35 dalam Series
s = s.replace(30, 35)
Menambah Data
Anda dapat menambah data ke dalam DataFrame atau Series menggunakan fungsi append(). Contoh:
# menambahkan baris baru ke dalam DataFrame
new_data = {'nama new_data = {'nama': 'Eka', 'umur': 25, 'gender': 'Perempuan'}
df = df.append(new_data, ignore_index=True)#menambahkan elemen baru ke dalam Series
new_data = pd.Series([60])
s = s.append(new_data, ignore_index=True)
# menghitung rata-rata umur dalam DataFrame
df['umur'].mean()
# menghitung nilai maksimum dalam Series
s.max()
Menghitung Statistik Data
Menghitung statistik data dalam Pandas menggunakan beberapa fungsi:
Mean
import pandas as pd
data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)
mean = df['nilai'].mean()
print(mean) # Output: 84.0
Median
import pandas as pd
data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)
median = df['nilai'].median()
print(median) # Output: 85.0
Mode
import pandas as pd
data = {'nilai': [70, 80, 90, 85, 95, 85, 85]}
df = pd.DataFrame(data)
mode = df['nilai'].mode()
print(mode) # Output: 0 85
# dtype: int64
Minimum
import pandas as pd
data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)
minimum = df['nilai'].min()
print(minimum) # Output: 70
Maximum
import pandas as pd
data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)
maximum = df['nilai'].max()
print(maximum) # Output: 95
Sum
import pandas as pd
data = {'nilai': [70, 80, 90, 85, 95]}
df = pd.DataFrame(data)
sum = df['nilai'].sum()
print(sum) # Output: 420
Kesimpulan
Pandas menyediakan operasi dasar yang mudah dan berguna untuk memanipulasi data, termasuk membuat DataFrame dan Series, mengambil data, menghapus data, mengganti data, menambah data, dan menghitung statistik data. Dalam artikel ini, telah dijelaskan bagaimana cara melakukan operasi dasar tersebut beserta contoh penggunaannya. Dengan menguasai operasi dasar ini, Anda akan lebih mudah dalam memanipulasi dan menganalisis data menggunakan Pandas.
Gabung dalam percakapan