Manipulasi Data dengan Pandas: Panduan Dasar Membaca, Menulis, Memilih, Memfilter, dan Mengurutkan Data
![Manipulasi Data dengan Pandas: Panduan Dasar Membaca, Menulis, Memilih, Memfilter, dan Mengurutkan Data Manipulasi Data dengan Pandas: Panduan Dasar Membaca, Menulis, Memilih, Memfilter, dan Mengurutkan Data](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj0i80msuk12htVpqVugNSR-mUv1E_Ik5qdLQjXvP_4y80WOk7ROMPxskp22_YCxurOo_95ln1EA2LRsA47UfdtMvhm9BWdHwhRc2lvZXYzl5kvi-doVbaUY5y0FkcNSLTAuZNK549fUaxdKlpIFNx2Mu9Ex9KgOJnrtFZc1XsreGAykXkJ4c23uC7Q/w640-h360/httpswww.contohapps.com%20-%20pandas.png)
1. Membaca Data
Pandas merupakan salah satu library Python yang digunakan untuk manipulasi dan analisis data. Salah satu fitur dari Pandas adalah kemampuannya dalam membaca berbagai jenis file, seperti CSV, Excel, dan SQL. Berikut adalah contoh membaca file CSV menggunakan Pandas:
import pandas as pd
df = pd.read_csv('nama_file.csv')
print(df.head())
Hasil output dari code di atas adalah 5 baris pertama dari data yang dibaca.
2. Menulis Data
Setelah data berhasil dibaca, selanjutnya kita dapat menulisnya ke dalam format file yang berbeda-beda. Contoh penggunaan Pandas untuk menulis file CSV adalah sebagai berikut:
import pandas as pd
df = pd.read_csv('nama_file.csv')
df.to_csv('nama_file_baru.csv', index=False)
Perintah index=False
digunakan untuk menghilangkan kolom indeks
saat data ditulis ke dalam file CSV baru.
3. Memilih Data
Kita dapat memilih kolom atau baris tertentu dari suatu DataFrame Pandas
menggunakan perintah loc
dan iloc
. Perintah
loc
digunakan untuk memilih baris atau kolom berdasarkan label,
sedangkan iloc
digunakan untuk memilih baris atau kolom
berdasarkan posisi.
import pandas as pd
df = pd.read_csv('nama_file.csv')
#Memilih kolom tertentu
df['nama_kolom']
#Memilih beberapa kolom
df[['kolom_1', 'kolom_2']]
#Memilih baris tertentu
df.loc[1]
#Memilih beberapa baris
df.loc[1:3]
#Memilih baris dan kolom tertentu
df.loc[1, 'nama_kolom']
#Memilih baris dan beberapa kolom
df.loc[1, ['kolom_1', 'kolom_2']]
#Memilih baris dan kolom berdasarkan posisi
df.iloc[1, 0]
4. Memfilter Data
Kita
dapat melakukan filter pada suatu DataFrame Pandas dengan menggunakan operator logika (&
untuk AND dan |
untuk OR) dan perintah isin
. Contoh penggunaannya sebagai berikut:
import pandas as pd
df = pd.read_csv('nama_file.csv')
Filter berdasarkan kondisi
df[df['kolom_1'] > 0]
Filter dengan operator logika
df[(df['kolom_1'] > 0) & (df['kolom_2'] < 10)]
Filter dengan perintah isin
df[df['nama_kolom'].isin(['nilai_1', 'nilai_2'])]
Kesimpulan
Pandas merupakan salah satu library Python yang sangat berguna dalam melakukan manipulasi dan analisis data. Beberapa operasi dasar yang dapat dilakukan dengan Pandas adalah membaca data, menulis data, memilih data, memfilter data, dan mengurutkan data. Dengan menguasai operasi-operasi dasar ini, kita dapat memanfaatkan seluruh potensi dari Pandas dalam mengolah data.
Gabung dalam percakapan