Model Sumber Daya-rasional Pemrosesan Manusia Dari Struktur Linguistik Rekursif Bagian 3

Jan 23, 2024

Eksperimen 2: Pengaruh Isyarat Semantik

Kami selanjutnya mereplikasi percobaan 1 pada kumpulan item kedua dan secara bersamaan menguji efek prediksi kompatibilitas semantik.

Kesesuaian semantik mengacu pada pemahaman dan penguasaan masyarakat terhadap kesesuaian dan keterkaitan antar satuan yang berbeda dalam bahasa, kata, atau simbol. Memori mengacu pada kemampuan seseorang untuk mengingat dan menyimpan informasi.

Ada hubungan erat antara kompatibilitas semantik dan memori. Kompatibilitas semantik yang baik dapat meningkatkan kualitas memori masyarakat, sedangkan kompatibilitas semantik yang buruk akan menghambat pemahaman informasi dan efek memori masyarakat.

Pertama, kompatibilitas semantik dapat meningkatkan relevansi informasi, sehingga membantu orang lebih memahami dan mengingat informasi. Jika terdapat korelasi yang jelas antara unit yang berbeda, orang dapat menggunakan korelasi ini untuk membangun hubungan antar informasi dan membentuk struktur jaringan antar informasi. Struktur jaringan ini dapat meningkatkan efek memori informasi dan meningkatkan kemampuan penyimpanan informasi masyarakat.

Kedua, kompatibilitas semantik yang baik dapat meningkatkan pemahaman suatu informasi, sehingga memudahkan orang untuk mengingatnya. Jika terdapat hubungan kesesuaian yang jelas antar informasi, masyarakat dapat dengan mudah memahami hubungan antar informasi tersebut, sehingga membentuk pemahaman dan ingatan terhadap informasi tersebut. Sebaliknya jika terdapat ketidaksesuaian yang jelas antar informasi, maka masyarakat akan merasa kebingungan dan bingung serta kesulitan dalam memahami dan mengingat informasi tersebut.

Terakhir, kompatibilitas semantik yang buruk dapat berdampak buruk pada kinerja memori manusia. Jika terdapat terlalu banyak perbedaan antar unit yang berbeda, maka akan sulit bagi orang untuk memahami dan mengingat informasi tersebut, sehingga kehilangan nilai memori. Oleh karena itu, dalam proses penulisan dan penyebaran informasi, kesesuaian semantik harus dijaga semaksimal mungkin untuk meningkatkan pemahaman dan ingatan masyarakat.

Singkatnya, ada hubungan yang kuat antara kompatibilitas semantik dan memori. Kompatibilitas semantik yang baik dapat meningkatkan relevansi dan pemahaman informasi, sehingga meningkatkan kemampuan penyimpanan informasi dan efek memori masyarakat. Oleh karena itu, dalam kehidupan dan pekerjaan sehari-hari, kompatibilitas semantik harus dijaga semaksimal mungkin untuk meningkatkan pemahaman dan memori informasi. Terlihat bahwa kita perlu meningkatkan daya ingat, dan Cistanche deserticola dapat meningkatkan daya ingat secara signifikan karena Cistanche deserticola merupakan bahan obat tradisional Tiongkok yang memiliki banyak khasiat unik, salah satunya meningkatkan daya ingat. Khasiat daging cincang berasal dari berbagai bahan aktif yang dikandungnya, antara lain asam, polisakarida, flavonoid, dll. Bahan-bahan tersebut dapat meningkatkan kesehatan otak dengan berbagai cara.

help with memory

Klik suplemen tahu untuk meningkatkan daya ingat

Di luar dua manipulasi dari percobaan 1, dalam kondisi DUA dan TIGA, kami juga memvariasikan frasa kata kerja kedua hingga terakhir: Dalam kondisi KOMPATIBEL, kata benda pertama adalah subjek yang masuk akal (misalnya, "menjengkelkan pasien"); dalam kondisi INCOMPATIBLE, versi tersebut tidak ada (misalnya, "menyembuhkan pasien"). Dalam kondisi COMPATIBLE, versi nonveridical seperti "laporan oleh..." harus memiliki probabilitas a priori yang lebih tinggi, membuat prediksi kata kerja terakhir kurang akurat. Kami membangun42 item stimulus.

Gambar 3B menunjukkan prediksi dari model rasional sumber daya dan teori sebelumnya untuk item ini. Selain efek dari eksperimen 1, model memperkirakan tingkat kesulitan yang lebih tinggi pada kondisi SESUAI, khususnya dalam TIGA. Baik teori kejutan maupun DLT tidak memprediksi adanya efek kompatibilitas.

Kami mengumpulkan data waktu membaca dari 200 peserta, termasuk varian SESUAI dan TIDAK SESUAI dalam kondisi DUA dan TIGA. Dalam semua hal lainnya, eksperimen dan analisis data identik dengan eksperimen 1. Waktu membaca ditunjukkan pada Gambar. 3B.

Hasil percobaan 1 direplikasi: Pertama, waktu membaca lebih tinggi di TIGA dibandingkan di DUA(=0.29, 95% CrI [0.24, 0.35], P( < 0) ​​< 0.0001; efek dalam waktu membaca mentah: 337 ms, 95% CrI [267, 411] ms).

Kedua, terdapat interaksi antara penyematan bias dan kehadiran klausa "itu" (=−0.06, 95% CrI [−0.1{ {9}}, −0,024],P( > 0)=0,0007). Seperti pada eksperimen 1, efek bias penyematan adalah positif pada kondisi SATU (perbedaan antara "fakta" dan "laporan": 193 ms, 95% CrI [37, 357] ms), dan negatif pada kondisi DUA dan TIGA (perbedaan antara " fakta" dan "laporan": −105 mdtk, 95% CrI [−194, −18]mdtk).

Ketiga, sesuai dengan prediksi model, waktu pembacaan lebih tinggi pada kondisi SESUAI dibandingkan kondisi TIDAK SESUAI ( {{0}}.083, 95% CrI [0.031, 0.136 ],P( < 0)=0.0014; efek dalam waktu membaca mentah: 96 ms, 95% CrI[36, 156] ms). Lihat Lampiran SI, bagian S3 untuk analisis lebih lanjut.

Perhatikan bahwa efek bias dan kompatibilitas penyematan secara numerik lebih besar pada TIGA kondisi dibandingkan pada DUA kondisi; meta-analisis menunjukkan bahwa perbedaan-perbedaan ini bermakna secara statistik baik pada waktu pembacaan maupun pada bagian ruang parameter model (Lampiran SI, bagian S2.1 dan S6.6).

Perbedaan numerik dalam kemiringan bias penyematan antaraCOMPATIBLE dan INCOMPATIBLE tidak bermakna secara statistik (Lampiran SI, Gambar. S23), begitu pula perbedaan numerik dalam intersep prediksi model antara kedua eksperimen (Lampiran SI, Gambar. S6).

Lihat Lampiran SI, bagian S6 untuk mengumpulkan bukti dari studi waktu membaca sebelumnya (total n=501). Kami selanjutnya mereplikasi efek menanamkan bias pada pemahaman dalam dua studi pemeringkatan (total n=335; Lampiran SI, bagian S5).

Eksperimen 3: Studi Produksi

Sejauh ini, kami telah mengkonfirmasi prediksi model dalam waktu membaca. Kesulitan yang diukur dalam waktu membaca menunjukkan bahwa ekspektasi manusia dilanggar, namun tidak secara langsung menunjukkan apa ekspektasi manusia tersebut.

Untuk memberikan tes kedua terhadap ekspektasi manusia, kami beralih ke paradigma produksi – penyelesaian Cloze (40,41) – yang telah digunakan dalam penelitian bahasa untuk mengevaluasi kata-kata apa yang diharapkan segera setelah pembukaan. Kami menggunakan metode ini untuk mengevaluasi kompleksitas struktur bertingkat ganda dan untuk mengukur berapa banyak kata kerja yang diharapkan manusia setelah pembukaan yang kompleks.*

Kami meminta peserta untuk melengkapi konteks formulir "Laporan bahwa dokter yang diplomat..." menjadi kalimat lengkap. Kami mengharapkan peserta untuk menghasilkan penyelesaian tata bahasa dengan tiga kata kerja, seperti "...tidak percaya menyembuhkan pasien itu mengejutkan," atau versi tidak tata bahasa dengan kata kerja yang lebih sedikit, seperti "...ketidakpercayaan itu mengejutkan." Kejutan konteks-hilang-rasional sumber daya memperkirakan bahwa tingkat penyelesaian yang tidak sesuai tata bahasa harus lebih rendah untuk kata benda dengan bias penyematan yang tinggi (misalnya, "fakta"), karena hal ini memudahkan untuk memulihkan konteks sebenarnya dari representasi memori yang tidak sempurna (Gbr. 4A). Model berbasis harapan dan memori yang ada tidak memprediksi bahwa tingkat penyelesaian tata bahasa bergantung pada bias penyematan.

improve cognitive function

Kami merekrut 80 peserta. Gambar 4 menunjukkan tingkat penyelesaian yang tidak lengkap (kurang dari tiga kata kerja) sebagai fungsi dari bias yang tertanam. Seperti yang diperkirakan, terdapat pengaruh bias penyematan pada tingkat respons tidak gramatikal (=−0.32, 95% CrI[−0.60, −0.05 ], P( > 0)=0.0123) dalam analisis efek campuran logistik percobaan demi percobaan.

Kami mereplikasi penelitian ini dalam dua bahasa lagi (Spanyol dan Jerman), termasuk satu bahasa (Jerman) yang tingkat kesulitan penyematannya di tengah jauh lebih lemah dibandingkan bahasa Inggris (42).

ways to improve your memory

Dalam bahasa Spanyol, kami menargetkan klausa relatif subjek (el hechode que el direktur que, "fakta bahwa sutradara yang") untuk menghindari klausa relatif subjek-objek awal yang kurang alami, sekaligus menguji generalisasi ke konfigurasi sintaksis yang berbeda. Di Jerman, kami menargetkan struktur tertanam (misalnya, Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, "kata Klaus bahwa klaim bahwa mahasiswa adalah profesor"), karena struktur tersebut diketahui meningkatkan kesulitan ke tingkat yang mendekati Bahasa Inggris (35).

Kami merekrut 60 peserta dalam setiap bahasa. Dalam kedua bahasa, pengaruh tingkat penyematan diperkirakan negatif, dengan perkiraan ukuran pengaruh sebanding dengan hasil bahasa Inggris (Spanyol:=−0.23, 95% CrI [−{{7 }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.

Diskusi

Kami telah memperkenalkan model pemrosesan bahasa manusia sebagai prediksi rasional sumber daya, yang diskalakan ke input arbitrer menggunakan metode pembelajaran mesin kontemporer. Bertujuan untuk merekonsiliasi perspektif berbasis memori dan ekspektasi pada pemrosesan sintaksis manusia, model ini tidak hanya memulihkan prediksi teori-teori sebelumnya yang benar, namun juga memprediksi interaksi yang sebelumnya tidak terdokumentasikan antara keterbatasan memori dan ekspektasi probabilistik, yang kami konfirmasikan dalam tiga eksperimen perilaku yang menyelidiki pemrosesan rekursif manusia. struktur.

Hasil kami mengungkapkan bahwa kesulitan yang terdokumentasi dengan baik dalam mengintegrasikan ketergantungan linguistik yang panjang, yang merupakan inti dari model berbasis memori yang ada (5, 7, 36), secara substansial dimodulasi oleh ekspektasi probabilistik: Perbandingan antara kondisi SATU dan TIGA menunjukkan bahwa kondisi tersebut Efek lokalitas dapat melemah atau bahkan terbalik ketika struktur sintaksis nonlokal memiliki probabilitas apriori yang tinggi, sebuah prediksi yang secara alami tidak muncul dari usulan penyatuan perspektif berbasis memori dan ekspektasi.

Pekerjaan kami selanjutnya mendokumentasikan tiga kelompok efek yang menonjol dari literatur psikolinguistik dalam satu eksperimen dan dengan satu model: efek lokalitas (peningkatan tingkat kesulitan TIGA), efek prediktabilitas (efek menanamkan bias dalam SATU kondisi), dan efek interferensi semantik (efek kompatibilitas semantik) ).

Ada minat yang besar terhadap perlakuan teoretis terpadu terhadap kelompok dampak ini; pekerjaan kami menunjukkan bagaimana satu model dapat mendeskripsikan, secara rinci, bagaimana mereka berinteraksi. Satu kelompok fenomena yang tidak menjadi sasaran eksperimen kami adalah interferensi berbasis kesamaan (43, 44). Menyelidiki apakah hal ini juga dapat dipertanggungjawabkan dengan kerangka pemodelan ini merupakan masalah yang menarik untuk penelitian di masa depan.

Model rasional sumber daya kami secara formal terkait dengan model di berbagai domain. Karya klasik telah menunjukkan bahwa analisis rasional terhadap probabilitas retensi dapat menjelaskan sifat dasar memori manusia (28, 29). Karya terbaru (45-48) telah memformalkan model rasional memori kerja manusia di beberapa domain, seperti memori kerja visual, menggunakan teori distorsi laju, kerangka teori informasi yang memperoleh pengkodean dengan ketelitian tinggi di bawah batasan sumber daya.

Perbedaan utama antara teori rate-distortion dan model kami adalah bahwa ukuran perekonomian adalah sebagian kecil dari kata-kata yang tersedia di sini, sedangkan ukuran bit adalah jumlah bit yang dikodekan dalam teori rate-distortion. Diterapkan pada pemahaman kalimat, teori laju-distorsi akan menghasilkan representasi "inti" konteks masa lalu yang terkompresi sepenuhnya. Representasi terkompresi penuh seperti itu tidak mengarah pada pola kesulitan yang diamati dalam eksperimen kami (lihat Lampiran SI, bagian S8 untuk rinciannya).

Di sisi lain, model kami juga merupakan penyederhanaan karena memodelkan konteks terkini sebagai rangkaian kata, yang mungkin meremehkan peran representasi memori dari konteks yang lebih panjang di mana kata-kata individual mungkin telah dilupakan namun memori maknanya tetap ada. Kemajuan lebih lanjut dalam mesin pembelajaran memungkinkan menyimpulkan format representasi memori yang lebih canggih dari optimalisasi sumber daya-rasional.

Dalam ilmu komputer, struktur rekursif biasanya diproses menggunakan struktur data berbasis tumpukan. Sejalan dengan itu, model awal pemrosesan sintaksis manusia mengasumsikan batasan pada ukuran tumpukan, atau jumlah node yang dapat disimpan dalam memori pada waktu yang sama (2, 24).

Model seperti ini memperkirakan bahwa penyematan yang lebih dalam akan lebih sulit, namun tidak memperkirakan bahwa kesulitan tersebut dimodulasi oleh isyarat statistik atau semantik. Tidak seperti arsitektur berbasis tumpukan, teori kami memberikan peran utama pada isyarat probabilistik dalam membangun struktur rekursif. Dalam hal ini, ia setuju dengan teori berbasis memori yang lebih baru yang berasumsi bahwa manusia tidak memelihara struktur data seperti tumpukan, dan, sebaliknya, membangun struktur sintaksis menggunakan pengambilan berbasis isyarat asosiatif (5, 7, 49, 50). Model pengambilan asosiatif seperti yang diterapkan saat ini (7) tidak memperhitungkan pola kesulitan khusus yang diprediksi oleh model kami dan diamati dalam eksperimen kami. Meskipun demikian, kami memandang teori kami sesuai dengan ide-ide dari literatur tersebut.

Teori kami memberikan model tingkat komputasi yang membuat prediksi kompatibel dengan model berbasis memori yang ada, namun—tidak seperti model tersebut—secara rasional disesuaikan dengan struktur statistik bahasa yang kaya, memungkinkannya memprediksi bagaimana keterbatasan memori berinteraksi dengan ekspektasi probabilistik. Hasil kami menunjukkan bahwa mengidentifikasi versi probabilistik dari model pengambilan asosiatif, sebagai implementasi tingkat algoritmik dari model rasional sumber daya yang dijelaskan di sini, merupakan masalah yang menarik untuk penelitian psikolinguistik. Lihat Lampiran SI, bagian S7.2 untuk informasi lebih lanjut mengenai implikasi hasil kami untuk model memori berbasis pengambilan.

Penyatuan model berbasis ekspektasi dan berbasis memori yang kami usulkan bertumpu pada gagasan bahwa representasi memori kerja yang tidak sempurna direkonstruksi secara rasional—walaupun terkadang salah menggunakan pengetahuan statistik bahasa. Ide ini memiliki preseden penting dalam upaya redintegrasi dalam memori kerja verbal ( misalnya, referensi 51–55), suatu proses dimana memori jangka pendek yang terdegradasi dipulihkan menggunakan pengetahuan dari memori jangka panjang. Hal ini telah diterapkan pada memori untuk daftar kata (misalnya, ref. 52-55) dan, yang lebih baru, memori untuk pola sintaksis (56). Model kami memberikan penjelasan tentang proses-proses tersebut berdasarkan inferensi Bayesian yang dibatasi oleh rasionalitas sumber daya. Ada juga model di mana memori kerja diperlakukan bukan sebagai komponen memori itu sendiri namun sebagai muncul dari interaksi pemrosesan dan memori jangka panjang (57, 58). Untuk model seperti itu, hasil kami memberikan data tentang bagaimana pengetahuan jangka panjang menginformasikan pemrosesan .

Eksperimen kami memanfaatkan korelasi statistik struktur sintaksis untuk menyelidiki bagaimana ekspektasi probabilistik berinteraksi dengan batasan memori. Hal ini memiliki beberapa kesamaan dengan penelitian sebelumnya pada model berbasis ekspektasi yang menunjukkan bagaimana korelasi, seperti antara animasi dan jenis klausa relatif, memengaruhi pemrosesan dengan cara yang tidak diperhitungkan oleh akun berbasis memori yang ada (misalnya, referensi 59–61). Pekerjaan kami memperluas bidang pekerjaan ini dengan mengartikulasikan teori yang diterapkan tentang interaksi antara batasan memori dan ekspektasi probabilistik.

Model kami memiliki parameter bebas δ, jumlah rata-rata kata yang dipertahankan. Kami mengasumsikan satu nilai dalam memperoleh prediksi dan membandingkannya dengan waktu membaca manusia. Menyesuaikannya dengan subjek individu dan memahami hubungannya dengan pengukuran perbedaan individu merupakan masalah yang menarik untuk penelitian di masa depan.

Model koneksionis dari pemrosesan sintaksis manusia (8, 62-64) bertujuan untuk mendeskripsikan pemrosesan manusia menggunakan ekspektasi yang berasal dari representasi jaringan saraf dan telah diusulkan untuk memodelkan efek yang terkait dengan keterbatasan memori dan ekspektasi probabilistik. Namun, perbedaan antara kejutan biasa yang dihitung dengan GPT-2 dan kejutan konteks kehilangan rasional sumber daya menunjukkan bahwa keterbatasan memori seperti manusia tidak perlu muncul secara otomatis dalam model koneksionis.

Kami telah menunjukkan bagaimana model pemrosesan bahasa yang rasional sumber daya dapat diskalakan ke struktur statistik bahasa alami yang kaya. Metode berbasis pembelajaran mesin kami dapat membuka pintu untuk menyesuaikan model rasional canggih pada statistik masukan alami dan juga dalam domain kognisi manusia lainnya.

Sifat umum dari model kami juga menunjukkan bahwa fenomena serupa mungkin terjadi di luar bahasa: Setiap kali manusia memproses masukan yang terlalu rumit untuk ditangani secara bersamaan, pemrosesan harus dipengaruhi oleh struktur statistik dari masukan yang serupa.

improve brain

Bahan dan metode

Kata benda. Kami mengumpulkan kata benda yang dapat dijadikan pelengkap kalimat, menggunakan Penn Treebank (65), English Web Treebank (66), AnCoRA treebank (67) dalam bahasa Spanyol, dan HDT Treebank (68) dalam bahasa Jerman. Kami memperkirakan penyematan log probabilitas bahwa "KATA BENDA" diikuti oleh "itu" menggunakan Wikipedia bahasa Inggris (2,3 miliar kata), Wikipedia bahasa Jerman (800 juta kata), dan Wikipedia bahasa Spanyol (500 juta kata). Lihat Lampiran SI, bagian S11 untuk rinciannya. Kami memvalidasi perkiraan bahasa Inggris menggunakan dua corpora besar lainnya yaitu Bahasa Inggris Amerika dan Inggris (Lampiran SI, bagian S10.1).

Model. Kejutan konteks kehilangan rasional sumber daya ditentukan oleh kelompok probabilitas retensi θ={qw, i: i, w}, dengan w berkisar pada kata dan i=1, ..., N, di mana N=20 adalah panjang konteks maksimum yang dipertimbangkan, cukup panjang untuk mengakomodasi semua konteks yang muncul dalam eksperimen. Kami membuat parameter qw, saya menggunakan jaringan saraf yang menggabungkan identitas kata masa lalu dan jumlah kata di dalamnya, untuk menghasilkan retensi probabilitas(Lampiran SI, bagian S1.1). Model θ memunculkan kemungkinan p(c|c) dan dengan demikian posterior p(c|c). Ini dipilih untuk meminimalkan rata-rata kejutan kata berikutnya untuk hasil posterior kata berikutnya p(w|c):

improve working memory

Pengaturan Eksperimental untuk Studi Waktu Membaca. Untuk semua penelitian, protokol eksperimental telah disetujui oleh Institutional Review Board di StanfordUniversity. Informed consent diperoleh dari semua peserta.

Setiap peserta diberikan 10 uji coba kritis. Dalam kedua percobaan, dua percobaan dilakukan dalam SATU, dan empat percobaan masing-masing dalam DUA dan TIGA. Pada percobaan 2, setengah dari percobaan DUA dan TIGA masing-masing berada dalam kondisi SESUAI (INCOMPATIBLE). Kami memilih sejumlah kecil uji coba kritis, untuk meminimalkan efek adaptasi statistik terhadap penyematan pusat selama tugas tersebut.

Untuk memaksimalkan ketepatan statistik, kami memilih 15 kata benda dengan bias penyematan yang sangat tinggi dan 15 kata benda dengan bias penyematan yang sangat rendah (Lampiran SI, Gambar. S36). Untuk setiap peserta, kami mengambil sampel lima kata benda dengan bias penyematan tinggi dan lima kata benda dengan nilai rendah dan mencocokkannya dengan 10 uji coba kritis. Untuk setiap peserta, kami juga mengambil sampel 30 pengisi dari kumpulan 56 pengisi dari studi waktu membaca sebelumnya tentang penyematan tengah (42).

Untuk menghilangkan anomali semantik karena pelanggaran pengandaian (misalnya, "faktanya salah"), kami mengklasifikasikan kata benda menjadi kata benda yang memerlukan (misalnya, "fakta"), netral yang tidak memiliki ekor (misalnya, "klaim"), dan kata benda yang tidak berekor negatif (misalnya, " tuduhan") kata benda, dan item yang diklasifikasikan untuk kesesuaian dengan masing-masing dari ketiga kelas ini (Lampiran SI, bagian S11). Untuk setiap peserta, kami mencocokkan 10 kata benda dengan item yang kompatibel secara semantik.

Untuk tugas labirin, kami menghasilkan pengecoh secara otomatis (39) menggunakan model bahasa Gulordava (69): pengecoh ini memiliki probabilitas kontekstual yang sangat rendah ketika dicocokkan dengan kata target dalam frekuensi dan panjangnya. Distraktor dicocokkan di seluruh kondisi, kecuali dalam detik ke -frasa kata kerja terakhir dalam kondisi (IN)SESUAI dalam percobaan 2. Secara khusus, pengecoh dicocokkan pada kata kritis di semua kondisi.

Ketika peserta melakukan kesalahan (yaitu memilih pengecoh), mereka diminta untuk mencoba kembali kata saat ini (70). Waktu reaksi pada uji coba tersebut tidak termasuk; pilihan ini tidak mempengaruhi kesimpulan (Lampiran SI, bagian S3.6).

Untuk setiap subjek, uji coba disajikan secara acak sehingga tidak ada dua uji coba kritis yang berdekatan. Peserta, yang direkrut pada platform akademik Prolific, mengambil waktu rata-rata 13 menit dan menerima £2,20 (≈3 USD).

Analisis Data untuk Waktu Membaca. Kami mengecualikan uji coba 1) dengan jawaban yang salah, 2) dari peserta yang membuat kesalahan lebih dari 20% kata, dan 3) di bawah atau di atas 99% dari seluruh waktu membaca. Lihat Lampiran SI, bagian S3.6 untuk ketahanan terhadap kondisi 1, dan lihat Lampiran SI, bagian S3.7 untuk ketahanan terhadap kondisi 3. Kami kemudian menganalisis waktu pembacaan log-transformed pada verba akhir menggunakan model efek campuran Bayesian yang diterapkan di Stan (71) menggunakan senjata (72). Lihat Lampiran SI, bagian S3.3 untuk mengetahui prioritas dan ketahanan terhadap pilihan sebelumnya. Kami menggunakan pengkodean kontras dengan kehadiran klausa "itu" (SATU vs. DUA/TIGA), kedalaman (DUA vs. TIGA), dan manipulasi kompatibilitas (SESUAI vs. TIDAK SESUAI) sebagai kontras. Bias penyematan dipusatkan, dan semua interaksi biner tidak kosong ditambahkan sebagai efek tetap (Lampiran SI, bagian S3.2).

Kami memasukkan struktur efek acak maksimal yang dibenarkan oleh desain eksperimental, memasukkan item, kata benda, dan partisipan sebagai efek acak. Untuk memperkirakan efek waktu pembacaan mentah (milidetik), pertama-tama kita menghitung log prediksi yang mengubah waktu pembacaan pada kedua kondisi (misalnya, SESUAI dan TIDAK SESUAI), kemudian mengubah keduanya menjadi milidetik dengan cara eksponensial, dan menghitung selisihnya (lihat Lampiran SI, bagian S3.4 untuk rincian lebih lanjut). Pada Gambar 3, kami memplot rata-rata posterior dari perkiraan waktu membaca dalam semua kondisi untuk kata benda dengan bias tertanam yang cocok dengan "fakta" atau "laporan". Bilah kesalahan mewakili SD posterior.

Detail untuk Studi Produksi. Kami menyusun 28 item dalam bentuk "XXXbahwa diplomat yang menjadi senator", dan memilih 12 kata benda, masing-masing 6 dengan bias penyematan yang sangat tinggi atau sangat rendah. Untuk setiap peserta, kami memasangkan item dan kata benda secara acak. 12 uji kritis disajikan secara acak dengan 27 pengisi. Ahli bahasa secara manual memberi keterangan, untuk setiap penyelesaian yang disediakan, apakah jumlah frasa kata kerja (tiga) yang benar telah dihasilkan. Anotator tidak mengetahui identitas kata benda tersebut.

Dalam bahasa Spanyol dan Jerman, kami memilih 20 kata benda dengan bias penyematan sangat tinggi atau sangat rendah di setiap bahasa, mengambil sampel 6 kata benda dengan bias penyematan tinggi dan 6 rendah untuk setiap peserta. Seperti dalam versi bahasa Inggris, kami secara acak mencocokkan 12 item dengan 12 sampel kata benda untuk setiap peserta. Pengisi diterjemahkan dari eksperimen bahasa Inggris.

Dalam bahasa Jerman, kami selanjutnya menyusun 12 kalimat matriks (misalnya, "Klaus mengatakan itu"), dan secara acak mencocokkannya dengan item dan kata benda untuk masing-masing peserta. Kami melakukan analisis efek campuran logistik uji coba Bayesian dengan bias penyematan sebagai efek tetap , dan efek acak dari kata benda, item, partisipan, dan kalimat matriks (dalam bahasa Jerman). Lihat Lampiran SI, bagian S4 untuk rinciannya.

Ketersediaan Data, Material, dan Perangkat Lunak. Probabilitas retensi dan prediksi model yang disesuaikan telah disimpan di Zenodo (https://zenodo.org/record/6602698) (73), (https://zenodo.org/record/6988696) (74). Waktu membaca yang dianonimkan, data produksi bahasa, dan kode sumber telah disimpan di GitLab (https://gitlab.com/m-hahn/resource-rational-surprisal) (75).

UCAPAN TERIMA KASIH. Kami berterima kasih kepada editor dan reviewer atas masukan konstruktif mereka, yang membantu memperbaiki naskah. Kami juga berterima kasih kepada Judith Degen, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Dan Jurafsky, PengQian, Cory Shain, Shravan Vasishth, Tom Wasow, Ethan Wilcox, dan hadirin di CUNY Conference on Sentence Processing 2020 atas diskusi dan masukan yang bermanfaat.

improve memory


Referensi

1. N. Chomsky, Struktur Sintaksis (Mouton, Den Haag, 1957).

2. GA Miller, N. Chomsky, "Model akhir pengguna bahasa" dalam Handbook of MathematicalPsychology, RD Luce, RR Bush, G. Galanter, Eds. (John Wiley, 1963), hlm.269–321.

3. L. Frazier, "Kompleksitas sintaksis" dalam Parsing Bahasa Alami: Perspektif Psikologis, Komputasi, dan Teoritis, DR Dowty, L. Karttunen, AM Zwicky, Eds. (Cambridge University Press, NewYork, 1985), hlm.129–189.
4. E. Gibson, Kompleksitas linguistik: Lokalitas ketergantungan sintaksis. Kognisi 68, 1–76 (1998).

5. B. McElree, S. Foraker, L. Dyer, Struktur memori yang mendukung pemahaman kalimat.J. Mem.Lang. 48, 67–91 (2003).

6. W. Tabor, B. Galantucci, DC Richardson, Pengaruh koherensi sintaksis lokal semata pada pemrosesan kalimat.J. Nona. Lang. 50, 355–370 (2004).

7. RL Lewis, S. Vasishth, Model pemrosesan kalimat berbasis aktivasi sebagai pengambilan memori terampil.Cogn. Sains. 29, 375–419 (2005).

8. MH Christiansen, MC MacDonald, Pendekatan berbasis penggunaan untuk rekursi dalam pemrosesan kalimat.Lang. Mempelajari. 59, 126–161 (2009).

9. J. Hale, (2001) "Pengurai awal probabilistik sebagai model psikolinguistik" dalam Prosiding Pertemuan Kedua Asosiasi Linguistik Komputasi Cabang Amerika Utara, NAACL 2001,L. Levin, K.Ksatria, Eds. (Asosiasi Linguistik Komputasi, Stroudsburg, PA), hlm.1–8.

10. R. Levy, Pemahaman sintaksis berbasis harapan. Kognisi 106, 1126–1177 (2008).

11. K. Rayner, AD Nah, Pengaruh kendala kontekstual pada gerakan mata dalam membaca: Pemeriksaan lebih lanjut. Psikon. Banteng. Wahyu 3, 504–509 (1996).

12. A. Staub, Pengaruh prediktabilitas leksikal terhadap gerakan mata dalam membaca: Tinjauan kritis dan interpretasi teoritis.Lang. Ahli bahasa. Kompas 9, 311–327 (2015).


For more information:1950477648nn@gmail.com



Anda Mungkin Juga Menyukai