Selama abad yang lalu, banyak peneliti telah mempelajari bahasa, bekerja dengan pembicara mereka, dan menerbitkan buku atau jenis deskripsi tata bahasa lainnya.
Grambank dibangun berdasarkan analisis penelitian ini dan basis data bahasa sebelumnya, tetapi dibandingkan dengan basis data sebelumnya, skalanya lebih besar dan lebih menyeluruh. Ini mengkodekan 195 kemungkinan fitur tata bahasa untuk sekitar 215 rumpun bahasa.
“Pemahaman kita tentang tata bahasa dan apa yang memberitahu kita tentang manusia dibatasi oleh apa yang dapat kita amati,” kata Haynie.
"Kami memasukkan pengamatan itu ke dalam kumpulan data ini, dan itu memungkinkan untuk perbandingan."
Karena saat ini ada sekitar 4.300 bahasa dengan deskripsi gramatikal yang diterbitkan dari sekitar 7.000 bahasa yang dikenal di dunia modern.
"Grambank sudah setengah jalan untuk menyandikan semua kemungkinan informasi tata bahasa yang dapat diekstraksi dari sumber data yang ada," kata Haynie.
Bahasa “tidak biasa”.
Dengan menggunakan Grambank, tim menemukan bahwa mereka dapat mengidentifikasi bahasa yang “tidak biasa”: bahasa yang menyimpang lebih jauh dari rata-rata dalam variasi yang biasanya ditemukan dalam bahasa, yang seringkali tidak memiliki bahasa saudara yang dikenal.
Tetapi mereka juga menemukan bahwa tidak ada yang aneh tentang bahasa yang terancam punah dibandingkan dengan bahasa yang tidak terancam punah.
“Banyak bahasa yang cukup biasa, dalam hal tata bahasa dasarnya, terancam punah karena berbagai alasan,” kata Haynie.
Bahasa Inggris, yang digunakan di seluruh dunia oleh 1,5 miliar orang, sebenarnya adalah “bahasa yang cukup aneh” menurut standar Grambank.
“Beberapa tempat dengan bahasa yang lebih 'tidak biasa' adalah tempat-tempat seperti Eropa dan Afrika Utara—bahasa yang kita, sebagai penutur bahasa Inggris, cenderung lebih akrab dengannya,” kata Haynie.