HomeKomputerPemetaan Jaringan Otak Berlapis-lapis melalui Pembelajaran Kontrastif Terpandu Segmentasi – Blog Google...

Pemetaan Jaringan Otak Berlapis-lapis melalui Pembelajaran Kontrastif Terpandu Segmentasi – Blog Google AI

Facebook
Twitter
Pinterest
WhatsApp

[ad_1]

Memetakan aktivitas pengkabelan dan pengaktifan otak manusia sangat penting untuk menguraikan cara kita berpikir — bagaimana kita merasakan dunia, belajar, memutuskan, mengingat, dan mencipta — serta masalah apa yang dapat muncul pada penyakit atau disfungsi otak. Upaya terbaru telah memberikan peta otak yang tersedia untuk umum (pemetaan 3D resolusi tinggi sel otak dan konektivitasnya) dengan kualitas dan skala yang belum pernah terjadi sebelumnya, seperti H01, rekonstruksi digital skala nanometer 1,4 petabyte dari sampel jaringan otak manusia dari Harvard / Google, dan kumpulan data korteks tikus milimeter kubik dari rekan-rekan kami di konsorsium MICRONS.

koneksi sinaptik, subkompartemen selulerdan jenis sel. Pembelajaran mesin dan teknologi visi komputer telah memainkan peran sentral dalam memungkinkan analisis ini, tetapi menerapkan sistem seperti itu masih merupakan proses yang melelahkan, membutuhkan berjam-jam pelabelan kebenaran dasar secara manual oleh annotator ahli dan sumber daya komputasi yang signifikan. Selain itu, beberapa tugas penting, seperti mengidentifikasi jenis sel dari hanya sebagian kecil dari akson atau dendritdapat menantang bahkan untuk pakar manusia, dan belum diotomatisasi secara efektif.

Hari ini, di “Peta Multi-Lapisan Neuropil dengan Pembelajaran Kontrastif yang Dipandu Segmentasi”, kami mengumumkan Pembelajaran Representasi Kontrastif yang Dipandu Segmentasi (SegCLR), sebuah metode untuk melatih representasi umum morfologi seluler (bentuk sel) dan struktur ultra (struktur internal sel) yang kaya dan generik tanpa upaya manual yang melelahkan. SegCLR menghasilkan representasi vektor kompak (yaitu, penyematan) yang berlaku di berbagai tugas hilir (misalnya, klasifikasi lokal subkompartemen seluler, pengelompokan tanpa pengawasan), dan bahkan mampu mengidentifikasi tipe sel hanya dari fragmen kecil sel. Kami melatih SegCLR pada kumpulan data korteks manusia H01 dan kumpulan data korteks tikus MICrONS, dan kami merilis vektor embedding yang dihasilkansekitar 8 miliar secara total, untuk dijelajahi para peneliti.

Dari sel-sel otak yang tersegmentasi dari blok jaringan 3D, penyematan SegCLR menangkap morfologi dan ultrastruktur seluler dan dapat digunakan untuk membedakan subkompartemen seluler (mis. tulang belakang dendritik versus poros dendrit) atau jenis sel (misalnya, berbentuk piramide melawan mikroglia sel).

Mewakili Morfologi Seluler dan Ultrastruktur

SegCLR dibangun di atas kemajuan terbaru dalam pembelajaran kontrastif yang diawasi sendiri. Kami menggunakan arsitektur jaringan dalam standar untuk mengkodekan input yang terdiri dari blok elektron 3D lokal mikroskopi data (sekitar 4 mikrometer pada satu sisi) ke dalam vektor embedding 64-dimensi. Jaringan dilatih melalui a kerugian kontras untuk memetakan input yang terkait secara semantik ke koordinat serupa di ruang embedding. Ini dekat dengan pengaturan SimCLR yang populerkecuali bahwa kami juga memerlukan segmentasi instans volume (menelusuri sel individu dan fragmen sel), yang kami gunakan dalam dua cara penting.

See also  Intel Akan Menjatuhkan Branding Celeron dan Pentium Dari Suku Cadang Laptop Pada 2023

Pertama, input data mikroskop elektron 3D secara eksplisit ditutupi oleh segmentasi, memaksa jaringan untuk fokus hanya pada sel pusat dalam setiap blok. Kedua, kami memanfaatkan segmentasi untuk secara otomatis menentukan input mana yang terkait secara semantik: pasangan positif untuk kerugian kontrastif diambil dari lokasi terdekat pada sel tersegmentasi yang sama dan dilatih untuk memiliki representasi yang serupa, sedangkan input yang diambil dari sel yang berbeda dilatih untuk memiliki representasi yang berbeda. . Yang penting, segmentasi otomatis yang tersedia untuk umum dari dataset manusia dan mouse cukup akurat untuk melatih SegCLR tanpa memerlukan peninjauan dan koreksi yang melelahkan oleh pakar manusia.

SegCLR dilatih untuk mewakili fitur seluler kaya tanpa pelabelan manual. Atas: Arsitektur SegCLR memetakan tampilan 3D bertopeng lokal dari data mikroskop elektron ke vektor penyematan. Hanya volume mikroskop dan draf segmentasi instans otomatis yang diperlukan. Bawah: Segmentasi juga digunakan untuk menentukan pasangan contoh positif versus negatif, yang representasinya didorong lebih dekat (positif, panah biru) atau lebih jauh lagi (negatif, panah merah) selama pelatihan.

Mengurangi Persyaratan Pelatihan Anotasi dengan Tiga Urutan Magnitudo

Embeddings SegCLR dapat digunakan dalam berbagai pengaturan hilir, apakah diawasi (misalnya, pengklasifikasi pelatihan) atau tidak diawasi (misalnya, pengelompokan atau pengambilan gambar berbasis konten). Dalam pengaturan yang diawasi, penyematan menyederhanakan pelatihan pengklasifikasi, dan dapat sangat mengurangi persyaratan pelabelan kebenaran dasar. Misalnya, kami menemukan bahwa untuk mengidentifikasi subkompartemen seluler (akson, dendrit, somadll.) pengklasifikasi linier sederhana yang dilatih di atas penyematan SegCLR mengungguli jaringan dalam yang diawasi sepenuhnya yang dilatih untuk tugas yang sama, sementara hanya menggunakan sekitar seribu contoh berlabel, bukan jutaan.

Kami menilai kinerja klasifikasi untuk akson, dendrit, soma, dan astrosit subkompartemen dalam dataset korteks manusia melalui rata-rata Skor F1, sambil memvariasikan jumlah contoh pelatihan yang digunakan. Pengklasifikasi linier yang dilatih di atas penyematan SegCLR cocok atau melampaui kinerja pengklasifikasi dalam yang diawasi sepenuhnya (garis horizontal), saat menggunakan sebagian kecil dari data pelatihan.

Membedakan Jenis Sel, Bahkan dari Fragmen Kecil

Membedakan jenis sel yang berbeda merupakan langkah penting untuk memahami bagaimana sirkuit otak berkembang dan berfungsi dalam kesehatan dan penyakit. Pakar manusia dapat belajar mengidentifikasi beberapa jenis sel kortikal berdasarkan fitur morfologis, tetapi pengetikan sel manual sulit dilakukan dan kasus yang ambigu sering terjadi. Pengetikan sel juga menjadi lebih sulit ketika hanya fragmen kecil sel yang tersedia, yang umum terjadi pada banyak sel saat ini rekonstruksi connectomic.

See also  Ulasan The Iceberg Thermal IceSLEET G6 Stealth: Pendingin Menara Kolosal Tingkat Atas
Pakar manusia secara manual melabeli tipe sel untuk sejumlah kecil sel proofread di setiap kumpulan data. Dalam dataset korteks tikus, para ahli memberi label enam jenis neuron (atas) dan empat glia jenis (tidak ditampilkan). Dalam dataset korteks manusia, para ahli memberi label dua jenis neuron (tidak ditampilkan) dan empat jenis glia (bawah). (Baris tidak untuk skala satu sama lain.)

Kami menemukan bahwa SegCLR secara akurat menyimpulkan tipe sel manusia dan tikus, bahkan untuk fragmen kecil. Sebelum klasifikasi, kami mengumpulkan dan merata-rata penyematan dalam setiap sel pada jarak agregasi yang ditetapkan, yang didefinisikan sebagai radius dari titik pusat. Kami menemukan bahwa tipe sel kortikal manusia dapat diidentifikasi dengan akurasi tinggi untuk radius agregasi sekecil 10 mikrometer, bahkan untuk tipe yang ahli. merasa sulit untuk membedakanseperti mikroglia (MGC) versus sel prekursor oligodendrosit (OPC).

SegCLR dapat mengklasifikasikan jenis sel, bahkan dari fragmen kecil. Kiri: Kinerja klasifikasi lebih dari enam tipe sel korteks manusia untuk dangkal ResNet model yang dilatih tentang penyematan SegCLR untuk fragmen sel berukuran berbeda. Jari-jari agregasi nol sesuai dengan fragmen yang sangat kecil dengan hanya satu penyisipan. Performa tipe sel mencapai akurasi tinggi (Skor F1 rata-rata 0,938) untuk fragmen dengan jari-jari agregasi hanya 10 mikrometer (titik kotak). Benar: Kelas-bijaksana matriks kebingungan pada radius agregasi 10 mikrometer. Bayangan yang lebih gelap di sepanjang diagonal menunjukkan bahwa tipe sel yang diprediksi sesuai dengan label ahli dalam banyak kasus. AC: astrosit; MGC: sel mikroglia; OGC: oligodendrosit sel; OPC: sel prekursor oligodendrosit; E: neuron rangsang; I: neuron penghambat.

Di korteks tikus, sepuluh jenis sel dapat dibedakan dengan akurasi tinggi pada radius agregasi 25 mikrometer.

Kiri: Kinerja klasifikasi pada sepuluh jenis sel korteks tikus mencapai 0,832 berarti F1-Score untuk fragmen dengan radius agregasi 25 mikrometer (titik kotak). Benar: Matriks kebingungan kelas pada radius agregasi 25 mikrometer. Kotak menunjukkan kelompok luas (glia, neuron rangsang, dan interneuron penghambat). P: sel piramidal; THLC: akson thalamocortical; SM: sel keranjang; BPC: sel bipolar; pembawa acara: Sel Martinotti; NGC: sel neurogliaform.
See also  Toolkit untuk Transparansi dalam Dokumentasi Set Data – Google AI Blog

Dalam aplikasi tipe sel tambahan, kami menggunakan pengelompokan penyematan SegCLR tanpa pengawasan untuk mengungkapkan subtipe neuron lebih lanjut, dan menunjukkan caranya estimasi ketidakpastian dapat digunakan untuk batasi klasifikasi ke subset kepercayaan tinggi dataset, misalnya, ketika hanya beberapa tipe sel yang memiliki label pakar.

Mengungkap Pola Konektivitas Otak

Terakhir, kami menunjukkan bagaimana SegCLR dapat digunakan untuk analisis otomatis konektivitas otak dengan mengetikkan sel mitra sinaptik sel yang direkonstruksi di seluruh dataset korteks tikus. Mengetahui pola konektivitas antara tipe sel tertentu sangat penting untuk menafsirkan rekonstruksi konektifitas skala besar dari kabel otak, tetapi ini biasanya memerlukan penelusuran manual untuk mengidentifikasi tipe sel pasangan. Menggunakan SegCLR, kami mereplikasi temuan konektivitas otak yang sebelumnya mengandalkan penelusuran manual intensif, sambil memperluas skalanya dalam hal jumlah sinapsis, tipe sel, dan area otak yang dianalisis. (Melihat kertas untuk rincian lebih lanjut.)

Analisis otomatis konektivitas otak SegCLR. Atas: Contoh sel piramidal tikus, dengan lokasi sinaps diberi kode warna menurut apakah pasangan sinaptik diklasifikasikan sebagai penghambat (biru), rangsang (merah), atau tidak diketahui (hitam). Inset menunjukkan detail yang lebih tinggi dari soma dan dendrit proksimal. Bawah: Kami menghitung berapa banyak mitra sinaptik hulu yang diklasifikasikan sebagai akson thalamocortical, yang membawa masukan dari sistem sensorik ke korteks. Kami menemukan bahwa input thalamic tiba terutama di lapisan kortikal L4, lapisan input kortikal kanonik, dan secara khusus menargetkan area visual primer V1, daripada area visual yang lebih tinggi (HVA).

Apa berikutnya?

SegCLR menangkap fitur seluler yang kaya dan dapat sangat menyederhanakan analisis hilir dibandingkan dengan bekerja secara langsung dengan gambar mentah dan data segmentasi. Kami senang melihat apa yang dapat ditemukan komunitas menggunakan ~8 miliar embedding yang kami rilis untuk dataset korteks manusia dan tikus (contoh kode akses; dapat dijelajahi manusia dan mouse tampilan di Ahli saraf). Dengan mereduksi data mikroskop yang kompleks menjadi representasi penyematan yang kaya dan kompak, SegCLR membuka banyak jalan baru untuk wawasan biologis, dan dapat berfungsi sebagai penghubung ke modalitas pelengkap untuk karakterisasi dimensi tinggi pada tingkat seluler dan subseluler, seperti transkriptomik yang diselesaikan secara spasial.

[ad_2]

Facebook
Twitter
Pinterest
WhatsApp
RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments