Meta telah mengumumkan iterasi terbaru dari Meta Segment Any Model (SAM). Segmen terbaru any model 2 merupakan penerus SAM yang dirilis setahun lalu. Raksasa teknologi tersebut mengklaim bahwa model barunya kini mendukung segmentasi objek dalam video dan gambar.
“Kami merilis SAM 2 di bawah lisensi Apache 2.0, sehingga siapa pun dapat menggunakannya untuk membangun pengalaman mereka sendiri. Kami juga membagikan dataset SA-V yang digunakan untuk membangun SAM 2 di bawah lisensi CC BY 4.0 dan merilis pengalaman demo berbasis web di mana setiap orang dapat mencoba versi model kami secara langsung,” kata Meta dalam rilis resminya. .
Apa itu SAM?
SAM adalah bagian dari lab FAIR (Fundamental AI Research) Meta dan dianggap sebagai lompatan besar berikutnya dalam visi komputer. Bagi yang belum tahu, visi komputer adalah bidang kecerdasan buatan yang memungkinkan komputer memahami data visual seperti gambar dan video. Jadi intinya, SAM adalah model AI, sebuah kemajuan dalam visi komputer. SAM Meta adalah model segmentasi canggih yang dikenal karena kemampuannya melakukan tugas segmentasi gambar yang kompleks dengan akurasi dan fleksibilitas tinggi. Untuk industri, SAM menganalisis data visual secara halus ke dalam segmen yang memungkinkan analisis dan inovasi akurat.
Sedangkan untuk SAM 2, Meta mengklaim bahwa model baru dapat mengidentifikasi piksel dalam gambar yang sesuai dengan objek yang diinginkan. Sekarang, ini adalah pekerjaan paling dasar di bidang computer vision. Versi SAM sebelumnya adalah model dasar untuk jenis pekerjaan gambar ini.
Meta menggambarkan SAM 2 sebagai model terpadu pertama untuk segmentasi objek secara real-time dan cepat dalam gambar dan video, memungkinkan perubahan bertahap dalam pengalaman segmentasi video. Dalam hal akurasi, SAM 2 mengungguli SAM jika dibandingkan dengan SAM, dan mencapai performa segmentasi video yang lebih baik daripada pekerjaan yang sudah ada. Model baru ini juga dapat mensegmentasi objek apa pun dalam video atau gambar apa pun, terutama konten visual yang sebelumnya tidak terlihat tanpa adaptasi khusus.
Bagaimana SAM 2 membantu pengguna?
Untuk menjelaskannya secara sederhana, SAM 2 membantu komputer memahami video dengan mengidentifikasi dan mengikuti objek dalam bingkai video. Hal ini dapat dipahami dengan membayangkan Anda sedang melacak pergerakan anjing di video. SAM 2 menggunakan isyarat sederhana seperti mengklik seekor anjing untuk menemukannya dalam satu bingkai. Ia kemudian mengingat hal ini dan terus melacak anjing tersebut melintasi bingkai, meskipun hewan tersebut bersembunyi dan muncul kembali. SAM 2 seperti memiliki asisten cerdas yang mengetahui kapan seekor anjing tersembunyi secara visual atau bercampur dengan objek lain. Alat seperti SAM 2 memudahkan dan mempercepat orang membuat anotasi video – catatan mendetail tentang segala sesuatu yang terjadi dalam video.
Model seperti SAM 2 mencakup berbagai kasus penggunaan di seluruh industri. Misalnya, dalam film dan media, model ini membantu mengotomatiskan proses pengeditan video dan efek khusus, sehingga menghasilkan efisiensi yang lebih besar dalam pascaproduksi. Dalam perawatan kesehatan, ini membantu dalam menganalisis video medis atau operasi dan pencitraan diagnostik untuk mendapatkan wawasan yang lebih baik. Dalam bidang keamanan dan pengawasan, hal ini dapat berguna dalam deteksi ancaman, dan dalam bidang ritel, hal ini dapat meningkatkan manajemen inventaris. Dalam bidang robotika, SAM 2 bisa menjadi terobosan karena memungkinkan robot menavigasi dan berinteraksi dengan objek di sekitarnya dengan lebih efisien.