Jejaring sosial memperkirakan peningkatan pengangguran (dua minggu sebelumnya)

Konteks publikasi yang menarik: ledakan kemarahan, permintaan rekomendasi – bahkan sebelum mereka menganggur.

Analisis ini dilakukan di AS namun dapat diterapkan di banyak negara lain: postingan media sosial memperkirakan peningkatan pengangguran (dua minggu sebelumnya).

Orang-orang curhat secara publik, meninggalkan permintaan bantuan, rekomendasi – bahkan ketika mereka belum resmi menjadi pengangguran. Atau, sederhananya, mereka mengumumkan bahwa mereka kehilangan pekerjaan.

Publikasi ini menyebar melalui jejaring sosial dan para peneliti berpendapat bahwa mereka dapat berfungsi sebagai a sistem peringatan dini terhadap lonjakan pengangguran — hingga dua minggu sebelum angka resmi Pemerintah dirilis.

HAI belajar menerapkan model kecerdasan buatan yang menganalisis X mencari publikasi langsung tentang pengangguran.

Sistem tersebut, yang disebut JoblessBERT, dilatih dengan publikasi dari 31,5 juta pengguna di Amerika Serikat antara tahun 2020 dan 2022; dirancang untuk mendeteksi formulasi informal dan banyak variabel bahwa pencarian kata kunci sederhana cenderung gagal — termasuk salah ejaan, bahasa gaul, dan ekspresi tegas.

HAI Blog Sains menjelaskan bahwa alih-alih mengukur suasana hati atau sentimen ekonomi yang lebih luas, model ini hanya berfokus pada hal tersebut pernyataan eksplisit yang menunjukkan kehilangan pekerjaan atau kebutuhan akan pekerjaan.

Dalam pengujian, peneliti melaporkan bahwa JoblessBERT hampir teridentifikasi tiga kali lebih banyak publikasi yang relevan dibandingkan pendekatan sebelumnya dengan tetap menjaga akurasi.

Karena pengguna X tidak mewakili populasi umum — mereka cenderung lebih muda dan mengecualikan banyak orang yang tidak pernah memposting tentang pekerjaan — tim menggunakan inferensi demografis dan geografis untuk memperkirakan usia, jenis kelamin, dan lokasi setiap pengguna.

Ini kemudian diselaraskan dengan proporsi Sensus AS melalui koreksi statistik yang dikenal sebagai pasca-stratifikasi. Dengan langkah ini, kata mereka, sistem dapat memprediksi klaim tunjangan pengangguran tidak hanya secara nasional, namun juga di tingkat negara bagian dan kota.

Modelnya juga digunakan giat belajar (pembelajaran aktif), suatu teknik yang meningkatkan kinerja dengan memfokuskan pelatihan pada kasus-kasus yang ambigu, di mana tidak jelas apakah suatu publikasi mengindikasikan kehilangan pekerjaan atau tidak.

Seiring waktu, hal ini membantu menangkap sampel bahasa dan pengguna yang lebih luas, yang mencakup wilayah dan kelompok demografi yang berbeda.

Pendekatan ini diuji pada minggu-minggu pertama “kejutan” tersebut COVID 19. Pada bulan Maret 2020, klaim awal tunjangan pengangguran di AS melonjak dari 278.000 menjadi hampir 6 juta dalam dua minggu karena lockdown meluas ke seluruh perekonomian. Dua hari sebelum minggu pelaporan resmi berakhir, JoblessBERT memperkirakan 2,66 juta lamaran; jumlah akhirnya adalah 2,9 juta — a perkiraan yang lebih dekat dibandingkan perkiraan banyak industri tradisional, yang secara signifikan meremehkan peningkatan tersebut.

Menurut peneliti, menggabungkan sinyal media sosial dengan metode prediksi standar mengurangi kesalahan perkiraan lebih dari 50% bertentangan dengan konsensus industri selama periode penelitian. Kemajuan paling terlihat dalam fase perubahan yang cepat, ketika pengumpulan data konvensional tertinggal.

Penulis menekankan bahwa model tidak dimaksudkan untuk menggantikan statistik resmi pasar tenaga kerja, yang semakin komprehensif dan kuat secara metodologis. Sebaliknya, mereka menyajikannya sebagai a suplemen waktu nyata — mampu menangkap apa yang dilaporkan masyarakat secara langsung, dan bukan apa yang muncul kemudian dalam survei atau catatan administratif.

Besar rintangan, Namun, itu adalah mengakses ke data. Dalam beberapa tahun terakhir, platform sosial telah memperketat pembatasan pengumpulan postingan publik oleh para peneliti, sehingga menimbulkan pertanyaan apakah sistem peringatan dini ini dapat dipertahankan pada skala yang diperlukan, bahkan dengan perlindungan privasi dan analisis anonim.



Tautan sumber