Menggunakan Agen AI dalam Pekerjaan Sehari-hari

12 minutes 0 0

Akhir-akhir ini, Kecerdasan Buatan, alias Artificial Intelligence (AI) makin moncer, terutama AI generatif.

gambar ilustrasi buatan AI menggunakan Gemini dengan model Nano Banana 2

Saya ingat saat kuliah, sekitar 2004, saya mendapatkan mata kuliah Kecerdasan Buatan, yang saat itu masih tergolong baru.

Cakupannya pun lebih ke machine learning, yaitu bagaimana mengidentifikasi masalah, mengumpulkan data berkualitas, memilih algoritma, melatih model, hingga melakukan evaluasi menggunakan sistem reward and punishment.

Saat itu, banyak sekali keterbatasannya, misalnya jumlah data yang digunakan untuk masukan, perangkat keras dan bahasa pemrograman, serta kurangnya domain expert yang bisa memverifikasi hasilnya.

Begitu juga dengan algoritma dan tekniknya juga belum secanggih sekarang.

Jika dulu Kecerdasan Buatan biasanya hanya bisa diakses oleh kalangan akademisi atau bidang pengembangan perangkat lunak, sejak ChatGPT dirilis ke publik oleh OpenAI pada tahun 2022, kini setiap orang bisa mengaksesnya.

Teknologi GPT yang digunakan oleh OpenAI dan banyak layanan lainnya merupakan singkatan dari Generative Pre-trained Transformer.

aplikasi ChatGPT dari OpenAI

Secara singkat, teknologi yang awalnya dikembangkan oleh Google pada tahun 2017-2019 ini adalah melihat hubungan antar kalimat dan kata, lalu menganalisis dan memprediksi kata dan kalimat berikutnya sesuai dengan pola dan data hasil training, lalu memberikan hasiilnya setelah melalui proses transformasi.

Ibarat kata, GPT adalah seperti seorang penulis super pintar yang sudah membaca seluruh buku di dunia, lalu bisa menjawab pertanyaan kita karena ia sudah mengenali pola pertanyaan dan jawaban yang telah ia pelajari.

Jadi sebenarnya, AI ini tidak “berpikir”, namun memberikan jawaban dari sumber apa yang telah ia pelajari.

Misalnya, karena ia sudah belajar banyak hal tentang memasak nasi goreng dari berbagai gagrak, saat orang bertanya “nasi goreng warna merah..”, si AI sudah bisa menebak bahwa yang dimaksud mungkin nasi goreng makassar atau surabaya, namun ia perlu menunggu kata berikutnya untuk memberikan jawaban yang tepat.

gambar ilustrasi buatan AI menggunakan Sora dari OpenAI

Kemampuan memprediksi ini juga kemudian berkembang tidak hanya menghasilkan percakapan, tapi juga ke multimodal, yaitu bisa menghasilkan gambar, suara, video, yang lagi-lagi berasal dari hasil training berbagai macam media.

Berbeda dengan teknologi Diffusion yang banyak menangani gambar dan video. Model ini justru mengurangi noise dari suatu gambar dari pola-pola yang dipelajari hingga menghasilkan gambar atau video.

Model Diffusion juga biasanya digunakan untuk melakukan manipulasi, seperti mengilangkan latar belakang, obyek, atau watermark pada suatu gambar.

Ibaratnya, Diffusion adalah seorang seniman patung yang memulai dengan batu utuh, lalu mengurangi bidang-bidang batu dengan memahat dan memukul, hingga terbentuk sosok patung, sesuai dengan apa yang diminta pengguna, tentunya sesuai data yang ia pelajari.

Perpaduan dua teknik tersebut, disebut dengan DiT (Diffusion Transformation), membuat kemampuan AI makin menjadi-jadi.

Salah satu contohnya adalah layanan Sora dari OpenAI yang bisa menghasilkan video dari prompt yang berupa teks.

Jika dulu, hasil olahan AI ini sangat buruk, misal jumlah jari yang berlebihan pada gambar manusia atau video Will Smith makan spaghetti yang aneh, makin ke sini hasilnya makin realistis.

Kembali ke soal penggunaan AI.

Makin ke sini, AI tidak hanya bisa digunakan untuk menjawab pertanyaan, namun bisa juga melakukan sesuatu.

Hal ini disebut dengan istilah agentic AI.

Seperti namanya, agen AI bisa melakukan sesuatu dengan mengakses tools, memiliki skills, dan bisa mempekerjakan subagent untuk menyelesaikan masalah secara mandiri.

Dalam dunia pengembangan perangkat lunak, beberapa agen AI yang populer adalah Claude Code bikinan Anthropic, Codex buatan OpenAI, dan Gemini CLI milik Google.

Tentunya setelah tulisan ini dibuat, akan ada banyak agen AI lain yang populer dan kemampuannya juga luar biasa.

Biasanya, agen-agen AI dieksekusi melalui terminal, atau CLI (Command Line Interface), dan pengguna memasukkan perintah seperti layaknya bercakap-cakap.

Bedanya, si agen AI bisa langsung mengeksekusi, dengan persetujuan pengguna.

Saking hebatnya, agen AI ini bahkan bisa membuat aplikasi yang bisa dijalankan, hanya dengan memasukkan perintah, bahkan hanya ide dan menjelaskan seperti apa aplikasinya, melalui prompt.

Dari sini lah istilah vibe coding muncul, di mana pengguna tidak menulis satu baris kode pun.

Istilah vibe coding pertama kali diciptakan oleh Andrej Karpathy, pakar AI terkenal mantan Direktur AI di Tesla dan salah satu pendiri OpenAI.

Vibe coding ini ibarat seperti sedang memasak dengan seorang asisten, di mana kita hanya berkata, “buatkan nasi goreng pedas”, dan si asisten akan mempersiapkan bahannya, bertanya dan meminta konfirmasi seberapa pedas, seberapa porsinya, dan lain-lain, hingga memasak si nasi goreng tersebut.

Bedanya dengan menggunakan chat, si AI hanya akan memberikan resep dan cara masaknya saja, dan kita tetep memasak sendiri.

Dari vibe coding ini kemudian muncul istilah baru, prompt engineering.

Prompt engineering adalah seni menulis instruksi (prompt) yang lebih terstruktur, disertai konteks, data, dan contoh, agar hasil olahan AI jadi lebih efektif dan tepat sasaran.

ilustrasi kucing memasak nasi goreng buatan AI menggunakan Gemini dengan model Nano Banana 2

Ibarat memasak nasi goreng, AI diberikan perintah yang lebih jelas, misalnya “buat nasi goreng merah ala Makassar pedas dengan beras sebanyak 200 gram dan cabe merah 3 buah”.

Dengan cara ini, selain hasilnya lebih efektif dan optimal, token yang digunakan juga jadi lebih hemat.

Token ini adalah secara gampangnya adalah “mata uang” yang digunakan untuk berkomunikasi dengan AI.

Kalo dulu, zaman masih menggunakan (((SMS))), sempat ada operator yang mengenakan tarif per huruf.

Kira-kira seperti itu gambaran penggunaan token di dunia AI.

Biaya penggunaan AI biasanya dihitung dari jumlah token yang digunakan, di mana token input yang kita masukkan dan token output yang merupakan hasil dari AI, biasanya berbeda ongkosnya.

Selain jumlah token, ada juga batasan penggunaan, terutama yang gratis, karena AI menggunakan resource yang cukup besar, apalagi jika si LLM (Large Language Model), si otak dari AI yang digunakan adalah yang terbaik.

LLM, atau yang sering disebut dengan model ini ibarat si orang pintar yang kita tanya-tanya.

Misal jika kita bertanya pada pakar, jawabannya akan berbeda dengan jika kita bertanya pada orang awam, dengan pertanyaan yang sama.

Begitu kira-kira untuk menganalogikan LLM.

Menggunakan Agen AI

maskot Claude Code

Kemampuan AI yang makin luar biasa ini digadang-gadang akan menggantikan peran manusia di bidang tertentu, termasuk dunia software engineering, bidang saya berkecimpung.

Namun manusia tentu harus terus belajar dan mengembangkan diri, agar tidak tergantikan oleh AI.

Banyak perusahaan teknologi yang merumahkan karyawannya dan menggantikannya dengan AI. Namun ternyata harapan tidak selalu terpenuhi, seperti yang terjadi pada Klarna.

Klarna, perusahaan fintech berbasis di Swedia ini sempat merumahkan 700 karyawannya, menggantikannya dengan AI, namun berakhir merekrut kembali karyawan yang mereka pecat, karena hasil AI tidak sesuai harapan perusahaan.

Beruntung, kantor saya justru mengadopsi dan mendorong karyawannya untuk menguasai, bahkan agar native dalam menggunakan AI.

Kami bahkan diberikan pelatihan, tidak hanya teknis, tapi juga etis, aturan, dan pedoman penggunaan AI di lingkup kerja dan sehari-hari, karena AI ibarat pisau yang memiliki dua mata.

Eropa bahkan telah menerbitkan aturan tentang penggunaan AI yang disahkan pada 1 Agustus 2024, untuk melindungi dampak buruk penyalahgunaan AI.

Di kantor, ada beberapa layanan AI yang bisa digunakan oleh karyawan, untuk mendukung produktivitas.

Layanan tersebut di antaranya adalah Google Gemini Pro, GitHub Copilot, Cursor, dan juga Claude Code.

tampilan Claude Code
tampilan Claude Code

Kantor juga memiliki perjanjian khusus dengan perusahaan-perusahaan AI tersebut, terutama dalam penanganan data perusahaan yang sensitif.

Tentu saja, meski sudah berhati-hati, ada kemungkinan data sensitif bisa masuk ke prompt secara tidak sengaja, dan perjanjian ini juga menjamin bahwa data tersebut tidak digunakan untuk hal lain seperti training.

Kantor juga mengembangkan sistem AI sendiri, untuk membantu karyawan menemukan berbagai informasi terkait urusan kantor, dengan antarmuka chat.

Dari beberapa tools AI yang disediakan, sebagai software engineer, saya lebih banyak menggunakan Cursor dan Claude Code.

GitHub Copilot lebih banyak digunakan untuk melakukan code review, karena kantor menggunakan GitHub sebagai repositori kode.

Saya pernah mencoba GitHub Copilot untuk asisten, namun hasilnya tidak memuaskan.

Gemini (chat) digunakan untuk hal-hal AI secara umum, yang memiliki akses ke internet.

Saya awalnya penggemar Cursor, terutama saat melakukan coding, Cursor bisa memberikan rekomendasi dan bahkan menulis kode yang lebih baik.

Kemudian, saya mencoba Claude Code, dan kini saya meninggalkan Cursor dan beralih ke Claude Code karena banyak fitur yang tersedia.

Saya makin ketagihan dengan Claude Code, apalagi kantor juga memberikan akses ke model-model terbaik keluaran Anthropic, seperti Opus-4.6 dan Sonnet-4.6 melalui AWS Bedrock.

Opus-4.6 sendiri termasuk model yang mahal, karena model ini sangat bagus untuk analisis dan menulis kode.

Tinggalkan Balasan

This article has been published on 11 Maret 2026 (12 jam ago).

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses