Membangun Memori AI (RAG) · Bab 2.1

Konsep RAG Sederhana

8 menit baca Memori AI Fundamental

Pernahkah kamu bertanya-tanya, "Bagaimana caranya membuat AI yang bisa menjawab pertanyaan berdasarkan ratusan dokumen rekap internal perusahaanku?" Dan ketika kamu bertanya begitu, biasanya akan ada *expert* yang menjawab: *"Mending kamu fine-tuning modelnya."* Berhentilah sekarang juga, karena itu adalah nasihat buram!

*Fine-tuning* sebuah AI layaknya membedah otak manusia dan melatih nuraninya agar paham filsafat mesin dan memakan jutaan dolar *compute cost*. Mengotak-atik nalar bawaan AI hanya untuk mengajarinya bahwa *"Password WiFi kantor ada di laci meja"* adalah pendekatan yang membuang biaya!

Katakan Halo pada R.A.G

Solusi terhebat di abad ini bernama Retrieval-Augmented Generation (RAG). RAG bisa kita analogikan sebagai Ujian Open Book bagi AI.

Bayangkan si AI adalah seorang sarjana cerdas (LLM) yang mengikuti ujian fisika kuantum perihal data perusahaanmu. Namun sang sarjana ini tidak membawa catatan dari rumah. Nah, daripada kamu harus menyekolahkan ulang dia (fine-tuning) bertahun-tahun, mengapa tidak kamu izinkan saja dia untuk membawa "Buku Panduan Internal Perusahaan" ke meja ujian (RAG)?

Si AI akan mencari teks yang relevan di buku panduan (Retrieval), menggabungkan kalimat dari buku tersebut dengan konteks pertanyaan aslimu (Augmented), baru kemudian meracik jawaban finalnya (Generation).

"Jangan mengajari LLM hafalan-hafalan mati yang rumit, melainkan berikan dia perpustakaan pribadi yang rapi." — Pedoman Utama Data Science Modern

Mekanisme RAG: Menjadi Pustakawan Mesin

Apa yang sebenarnya terjadi di balik layar ketika kamu meminta AI Agent men-summarize laporan pajak perusahaanmu yang berformat PDF setebal 100 lembar?

  1. Chunking (Mencincang Data): File PDF-mu tidak disuapkan utuh-utuh. RAG akan memotong dokumen tersebut menjadi potongan-potongan kecil setara 1-2 paragraf. Analogi: Memotong roti utuh menjadi kotak kecil agar mudah dikunyah.
  2. Embedding: Potongan teks itu diubah menjadi serangkaian angka matematika (vektor). Ini agar mesin bisa tahu bahwa *"Pajak Pertambahan Nilai"* dan *"PPN"* bermakna berdekatan meski hurufnya beda!
  3. Pencarian Cerdas (Semantic Search): Ketika bosmu bertanya, "Berapa PPN bulan lalu?", RAG akan meluncur cepat ke lautan angka tadi dan mengambil 3 potong paragraf yang makna intinya merujuk pada "pajak" dan "bulan lalu".
  4. Generasi Jawaban: AI-nya (misal gpt-4) lantas *diberikan* 3 potong paragraf tersebut di belakang panggung: *"Konteks: PPN bulan lalu tercatat Rp 120 juta. Tolong jawab pertanyaan bos!"* lalu AI-nya akan berkata, *"Halo Bos, berdasarkan catatan, PPN kita Rp 120 juta."*

Menyelamatkan Perusahaan dari "Halusinasi"

Keuntungan mematikan dari sistem ini bukan cuma pada efisiensi biaya, lantas kemampuan untuk **membunuh halusinasi**. Jika AI Agent-mu diberi sistem RAG dengan arahan: "Jika jawabannya tidak ada di dokumen yang berhasil kamu temukan, katakan saja SAYA TIDAK TAHU". Boom! Kamu seketika memiliki AI Perusahaan yang 100% jujur, patuh privasi (karena data dipisah tidak *trainable*), dan bisa dirunut sumurnya (karena RAG bisa melampirkan referensi "Dikutip dari PDF halaman 4").

Ringkasan Bab

  • RAG adalah proses menyuapkan informasi eksternal ke dalam model AI agar mereka bisa menjawab tanpa *fine-tuning*.
  • Proses RAG memecah dokumen besar, menangkap konteks yang relevan saat ditarget, lalu dikirim ke model sebatas sebagai *"contekan"* sebelum dia bergenerasi.
  • RAG mencegah *halusinasi* parah dengan memutus rantai nalar asal tebak dari sistem inti.

Kuis Sub-bab

3 huruf — singkatan Retrieval-Augmented Generation

› Konsep mengambil dokumen spesifik untuk dimasukkan ke konteks AI sebelum menjawab disebut...