HomeKomputerMenggunakan Peta Molekuler untuk Memahami Bau – Blog Google AI

Menggunakan Peta Molekuler untuk Memahami Bau – Blog Google AI

Facebook
Twitter
Pinterest
WhatsApp

[ad_1]

Apakah Anda pernah mencoba mengukur bau? …Sampai Anda dapat mengukur kemiripan dan perbedaannya, Anda tidak akan memiliki ilmu bau. Jika Anda berambisi untuk menemukan ilmu baru, ukurlah baunya.
— Alexander Graham Bell, 1914.

Bagaimana bisa kita mengukur bau? Bau diproduksi oleh molekul yang melayang di udara, masuk ke hidung kita, dan mengikat reseptor sensorik. Berpotensi miliaran molekul dapat menghasilkan bau, jadi mencari tahu mana yang menghasilkan bau mana yang sulit untuk dikatalogkan atau diprediksi. Indrawi peta dapat membantu kami memecahkan masalah ini. Penglihatan warna memiliki contoh peta yang paling dikenal, mulai dari roda warna yang kita pelajari di sekolah dasar hingga varian yang lebih canggih yang digunakan untuk melakukan koreksi warna dalam produksi video. Sementara peta-peta ini telah ada selama berabad-abad, peta-peta yang berguna untuk penciuman telah hilang, karena penciuman adalah masalah yang lebih sulit dipecahkan: molekul-molekul bervariasi dalam lebih banyak cara daripada foton; pengumpulan data membutuhkan kedekatan fisik antara pencium dan penciuman (kami tidak memiliki “kamera” penciuman dan “monitor” penciuman); dan mata manusia hanya memiliki tiga reseptor sensorik untuk warna sedangkan hidung manusia memiliki > 300 untuk bau. Akibatnya, upaya sebelumnya untuk menghasilkan peta bau gagal mendapatkan daya tarik.

kami mengembangkan jaringan saraf graf (GNN) model yang mulai mengeksplorasi ribuan contoh molekul berbeda yang dipasangkan dengan label bau yang ditimbulkannya, misalnya, “beef”, “floral”, atau “minty”, untuk mempelajari hubungan antara struktur molekul dan kemungkinan molekul tersebut akan memiliki setiap label bau. Ruang penyisipan model ini berisi representasi setiap molekul sebagai vektor panjang tetap yang menggambarkan molekul itu dalam hal baunya, seperti nilai RGB dari stimulus visual yang menggambarkan warnanya.

Kiri: Contoh peta warna (CIE 1931) di mana koordinat dapat langsung diterjemahkan ke dalam nilai rona dan saturasi. Warna serupa terletak berdekatan satu sama lain, dan panjang gelombang cahaya tertentu (dan kombinasinya) dapat diidentifikasi dengan posisi pada peta. Benar: Bau di Peta Bau Utama beroperasi dengan cara yang sama. Molekul individu sesuai dengan titik (abu-abu), dan lokasi titik-titik ini mencerminkan prediksi karakter baunya.

Hari ini kami memperkenalkan “Principal Odor Map” (POM), yang mengidentifikasi representasi vektor dari setiap molekul bau dalam ruang embedding model sebagai satu titik dalam ruang dimensi tinggi. POM memiliki sifat peta sensorik: pertama, pasangan bau yang mirip secara persepsi sesuai dengan dua titik terdekat di POM (dengan analogi, merah lebih dekat ke oranye daripada hijau pada roda warna). Kedua, POM memungkinkan kita untuk memprediksi dan menemukan bau baru dan molekul yang menghasilkannya. Dalam serangkaian makalah, kami menunjukkan bahwa peta dapat digunakan untuk memprediksi sifat bau molekul secara prospektif, memahami sifat-sifat ini dalam hal biologi dasar, dan mengatasi masalah kesehatan global yang mendesak. Kami membahas masing-masing aplikasi POM yang menjanjikan ini dan bagaimana kami mengujinya di bawah ini.

See also  Mencoba Memilih GPU Seri RTX 40 Baru Anda? ASUS Memiliki Dua Pilihan Perkasa Untuk Anda

Tes 1: Menantang Model dengan Molekul yang Belum Pernah Berbau

Pertama, kami bertanya apakah model yang mendasarinya dapat memprediksi dengan benar bau baru molekul yang belum pernah dicium siapa pun sebelumnya dan itu sangat berbeda dari molekul yang digunakan selama pengembangan model. Ini adalah pengujian penting — banyak model berkinerja baik pada data yang terlihat mirip dengan apa yang telah dilihat model sebelumnya, tetapi rusak saat diuji pada kasus baru.

Untuk menguji ini, kami mengumpulkan kumpulan data deskripsi bau terbesar untuk molekul baru. Mitra kami di Pusat Monell panelis terlatih untuk menilai bau masing-masing dari 400 molekul menggunakan 55 label berbeda (misalnya, “minty”) yang dipilih untuk menutupi ruang kemungkinan bau sementara tidak berlebihan atau terlalu jarang. Tidak mengherankan, kami menemukan bahwa orang yang berbeda memiliki karakterisasi yang berbeda dari molekul yang sama. Inilah sebabnya mengapa penelitian sensorik biasanya menggunakan panel yang terdiri dari lusinan atau ratusan orang dan menyoroti mengapa penciuman merupakan masalah yang sulit dipecahkan. Daripada melihat apakah model tersebut dapat cocok dengan satu orang, kami menanyakan seberapa dekat dengan konsensus: rata-rata di semua panelis. Kami menemukan bahwa prediksi model lebih mendekati konsensus daripada rata-rata panelis. Dengan kata lain, model menunjukkan kemampuan luar biasa untuk memprediksi bau dari struktur molekul.

Prediksi yang dibuat oleh dua model, model GNN kami (oranye) dan model hutan acak chemoinformatic (RF) dasar (biru), dibandingkan dengan peringkat rata-rata yang diberikan oleh panelis terlatih (hijau) untuk molekul 2,3-dihydrobenzofuran-5-carboxaldehyde . Setiap batang sesuai dengan satu label karakter bau (dengan hanya 17 teratas dari 55 yang ditampilkan untuk kejelasan). Lima teratas ditunjukkan dalam warna; model kami dengan benar mengidentifikasi empat dari lima teratas, dengan keyakinan tinggi, vs. hanya tiga dari lima, dengan keyakinan rendah, untuk model RF. Korelasi (R) ke set lengkap 55 label juga lebih tinggi dalam model kami.
Tidak seperti model benchmark alternatif (RF dan model tetangga terdekat yang dilatih pada berbagai set fitur chemoinformatic), model GNN kami mengungguli panelis manusia median dalam memprediksi peringkat rata-rata panel. Dengan kata lain, model GNN kami lebih mencerminkan konsensus panel daripada panelis biasa.

Badan POM juga memamerkan kinerja mutakhir pada tugas-tugas penciuman manusia alternatif seperti mendeteksi kekuatan bau atau kesamaan bau yang berbeda. Jadi, dengan POM, seharusnya memungkinkan untuk memprediksi kualitas bau dari miliaran molekul bau yang belum diketahui, dengan aplikasi luas untuk rasa dan aroma.

See also  Membuat Lubang Cacing yang Dapat Dilintasi dengan Komputer Kuantum – Google AI Blog

Tes 2: Menghubungkan Kualitas Bau Kembali ke Biologi Dasar

Karena Peta Bau Utama berguna dalam memprediksi persepsi bau manusia, kami bertanya apakah itu juga dapat memprediksi persepsi bau pada hewan, dan aktivitas otak yang mendasarinya. Kami menemukan bahwa peta tersebut berhasil memprediksi aktivitas reseptor sensorik, neuron, dan perilaku pada sebagian besar hewan yang telah dipelajari oleh ahli saraf penciuman, termasuk tikus dan serangga.

Fitur umum apa dari dunia alami yang membuat peta ini dapat diterapkan pada spesies yang dipisahkan oleh evolusi ratusan juta tahun? Kami menyadari bahwa tujuan umum dari kemampuan untuk mencium mungkin untuk mendeteksi dan membedakan antara keadaan metabolisme, yaitu, untuk merasakan ketika sesuatu matang vs busuk, bergizi vs lembam, atau sehat vs sakit. Kami mengumpulkan data tentang reaksi metabolisme dalam lusinan spesies di seluruh kerajaan kehidupan dan menemukan bahwa peta tersebut berhubungan erat dengan metabolisme itu sendiri. Ketika dua molekul berjauhan dalam bau, menurut peta, serangkaian reaksi metabolisme yang panjang diperlukan untuk mengubah satu molekul menjadi yang lain; sebaliknya, molekul yang berbau serupa dipisahkan hanya dengan satu atau beberapa reaksi. Bahkan jalur reaksi panjang yang berisi banyak langkah menelusuri jalur mulus melalui peta. Dan molekul yang terjadi bersama dalam zat alami yang sama (misalnya, jeruk) sering sangat rapat di peta. POM menunjukkan bahwa penciuman terkait dengan alam kita melalui struktur metabolisme dan, mungkin mengejutkan, menangkap prinsip-prinsip dasar biologi.

Kiri: Kami mengumpulkan reaksi metabolisme yang ditemukan di 17 spesies di 4 kerajaan untuk membuat grafik metabolisme. Dalam ilustrasi ini, setiap lingkaran adalah molekul metabolit yang berbeda dan panah menunjukkan bahwa ada reaksi metabolisme yang mengubah satu molekul menjadi molekul lain. Beberapa metabolit memiliki bau (warna) dan yang lain tidak (abu-abu), dan jarak metabolisme antara dua metabolit yang berbau adalah jumlah minimum reaksi yang diperlukan untuk mengubah satu menjadi yang lain. Di jalur yang ditunjukkan dalam huruf tebal, jaraknya adalah 3. Benar: Jarak metabolisme sangat berkorelasi dengan jarak di POM, perkiraan perbedaan bau yang dirasakan.

Tes 3: Memperluas Model untuk Mengatasi Tantangan Kesehatan Global

Peta bau yang terkait erat dengan persepsi dan biologi di seluruh kerajaan hewan membuka pintu baru. Nyamuk dan serangga hama lainnya tertarik pada manusia sebagian oleh milik mereka persepsi bau. Karena POM dapat digunakan untuk memprediksi penciuman hewan umumnyakami melatihnya kembali untuk mengatasi salah satu masalah terbesar umat manusia, momok penyakit yang ditularkan oleh nyamuk dan kutu, yang membunuh ratusan ribu orang setiap tahun.

See also  Pembelajar Bahasa Terpadu Sumber Terbuka – Blog Google AI

Untuk tujuan ini, kami meningkatkan model asli kami dengan dua sumber data baru: (1) a serangkaian eksperimen yang sudah lama terlupakan dilakukan oleh USDA pada sukarelawan manusia mulai 80 tahun yang lalu dan baru-baru ini ditemukan oleh buku Google, yang kemudian kami buat agar dapat dibaca oleh mesin; dan (2) kumpulan data baru yang dikumpulkan oleh mitra kami di TropIQ, menggunakan uji nyamuk laboratorium throughput tinggi mereka. Kedua set data mengukur seberapa baik molekul tertentu menjauhkan nyamuk. Bersama, model yang dihasilkan dapat memprediksi pengusir nyamuk dari hampir semua molekul, memungkinkan layar virtual di atas petak besar ruang molekuler. Kami memvalidasi layar ini secara eksperimental menggunakan molekul yang sama sekali baru dan menemukan lebih dari selusin molekul dengan daya tolak setidaknya setinggi DEET, bahan aktif di sebagian besar penolak serangga. Obat nyamuk yang lebih murah, tahan lama, dan lebih aman dapat mengurangi insiden penyakit di seluruh dunia seperti malaria, yang berpotensi menyelamatkan banyak nyawa.

Kami mendigitalkan data pengusir nyamuk USDA untuk ribuan molekul yang sebelumnya dipindai oleh Google Buku, dan menggunakannya untuk menyempurnakan representasi yang dipelajari (peta) di jantung model. Kami menambahkan lapisan tambahan, khususnya untuk memprediksi penolakan dalam pengujian pengumpan nyamuk, dan secara iteratif melatih model untuk meningkatkan prediksi pengujian saat menjalankan layar komputasi untuk kandidat pengusir nyamuk.
Banyak molekul yang menunjukkan sifat pengusir nyamuk di uji laboratorium juga menunjukkan sifat pengusir nyamuk bila diterapkan pada manusia. Beberapa menunjukkan penolak yang lebih besar daripada penolak yang paling umum digunakan saat ini (DEET dan picaridin).

Jalan di depan

Kami menemukan bahwa pendekatan pemodelan kami untuk prediksi bau dapat digunakan untuk menggambar Peta Bau Utama untuk mengatasi masalah terkait bau secara lebih umum. Peta ini adalah kunci untuk mengukur bau: menjawab berbagai pertanyaan tentang bau baru dan molekul yang menghasilkannya, menghubungkan bau dengan asal-usulnya dalam evolusi dan alam, dan membantu kita mengatasi tantangan kesehatan manusia yang penting yang mempengaruhi jutaan orang. Ke depan, kami berharap pendekatan ini dapat digunakan untuk menemukan solusi baru untuk masalah formulasi makanan dan wewangian, pemantauan kualitas lingkungan, dan deteksi penyakit manusia dan hewan.

Ucapan Terima Kasih

Pekerjaan ini dilakukan oleh tim peneliti penciuman ML, termasuk Benjamin Sanchez-Lengeling, Brian K. Lee, Jennifer N. Wei, Wesley W. Qian, dan Jake Yasonik (dua yang terakhir sebagian didukung oleh program Peneliti Mahasiswa Google) dan mitra eksternal kami termasuk Emily Mayhew dan Joel D. Mainland dari Monell Center, dan Koen Dechering dan Marnix Vlot dari TropIQ. Tim Google Buku membawa dataset USDA online. Richard C. Gerkin didukung oleh program Google Visiting Faculty Researcher dan juga Associate Research Professor di Arizona State University.

[ad_2]

Facebook
Twitter
Pinterest
WhatsApp
RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments