Analisis Model gol yang bisa di harapkan

  • Bagaimana Anda menghitung tujuan yang diharapkan?
  • Apa saja pendekatan yang berbeda terhadap pemodelan sasaran yang diharapkan?
  • Model harapan apa yang paling diharapkan adalah model yang paling akurat?

An analysis of different expected goals models

Analisis Model Gol

Sebelumnya terbatas pada komunitas data olahraga kecil, metrik tujuan yang diharapkan sekarang memiliki fitur statistik sepak bola umum lainnya seperti kepemilikan, tembakan berdasarkan target dan jumlah pelanggaran yang dilakukan. Namun, ada banyak pendekatan terhadap sasaran yang diharapkan. Artikel ini membahas berbagai model yang digunakan dan bagaimana mereka menghasilkan keluaran yang berbeda.

Tujuannya dalam sepak bola adalah mencetak gol lawan lawan tanpa kebobolan satu gol. Kedengarannya sederhana tapi karena hal-hal seperti keacakan dan keberuntungan, tim tidak selalu mendapatkan hasil yang “pantas mereka dapatkan”.

Inilah sebabnya mengapa analisis data dan metrik seperti sasaran yang diharapkan berguna dalam judi olahraga – kita dapat menganalisis kinerja dari sudut pandang yang lebih analitis dan memberikan substansi pada klaim seperti “mereka tidak beruntung untuk tidak menang.”

Tujuan yang diharapkan (sering disingkat xG) adalah salah satu bentuk analisis data yang digunakan tim sepak bola dan merupakan sesuatu yang menjadi semakin populer di kalangan bettors. Statistik tujuan yang diharapkan banyak tersedia secara online namun tidak selalu sama karena model yang berbeda digunakan untuk menghitungnya.

Model dapat berkisar dari yang sederhana sampai yang kompleks dan di bawah ini adalah penjelasan tentang bagaimana model kerja harapan yang berbeda. Lalu apa mekanismenya di balik model yang berbeda ini dan seberapa berbedanya keluaran yang mereka hasilkan?

Baca juga Untuk pertandingan judi bola voliĀ 

Menggunakan data tembakan dasar

Andrew Beasley sebelumnya telah menjelaskan bagaimana menghitung tujuan yang diharapkan dengan menggunakan model data tembakan dasar. Karena tembakan adalah tindakan yang menentukan dari sebuah gol, data yang diambil adalah kunci untuk setiap model sasaran yang diharapkan – ada banyak peristiwa dalam pertandingan sepak bola yang berkontribusi pada gol yang dicetak namun saat mencoba memprediksi hasil akhir ini, tembakan tidak diragukan lagi merupakan yang paling banyak. penting.

heat-map-inarticle.jpg

Ini adalah pendekatan sederhana yang menggunakan apa yang Opta definisikan sebagai “peluang besar” – situasi di mana pemain diharapkan bisa mencetak gol – serta tembakan yang diambil dari dalam dan luar kotak.

Tingkat konversi dari lima musim Premier League terakhir berarti peluang besar memiliki nilai xG 0,387 (38,7% kesempatan mencetak gol), tembakan di dalam kotak memiliki nilai 0,070 dan yang dari luar kotak memiliki nilai 0,036.

Detil analisis data shot

Mengingat ukuran lapangan dalam sepak bola, berbagai sudut dari mana tembakan dapat diambil dan dampaknya terhadap kemungkinan mencetak gol, apakah model menganalisa lokasi tembakan secara lebih rinci akan mempengaruhi keluaran sasaran yang diharapkan.

grid-inarticle.jpg

Meskipun mirip dengan model dasar yang diharapkan Andrew Beasley, pendekatan semacam ini menggunakan analisis lokasi yang lebih mendalam, sebuah tembakan diambil dari untuk menetapkan nilai xG-nya. Cara termudah untuk melakukannya adalah dengan membagi jarak tembak ke gawang menjadi petak dan plot setiap tembakan.

Keuntungan menggunakan model semacam ini adalah menyumbang perbedaan dalam pemotretan pemain langsung di depan gawang (sangat mungkin mencetak gol) dan pemain yang menembak dari sudut akut (jauh lebih kecil kemungkinannya mencetak gol) dan juga apakah tembakan itu berasal dari kepala pemain (sulit mencetak gol) atau kaki (lebih mudah mencetak gol).

Model Paul Riley adalah contoh bagus untuk mengambil pendekatan yang sedikit lebih maju untuk menganalisis data lokasi tembakan saat membangun model xG.

Pertimbangan proses penyerangan

Tentu saja, bukan hanya di mana tembakan diambil dan bagian tubuh apa yang digunakan yang akan menentukan seberapa besar kemungkinan upaya untuk dikonversi. Bagian permainan yang mendahului tembakan akan berpengaruh pada kualitas kesempatan itu.

Alih-alih hanya menetapkan nilai xG pada tembakan berdasarkan tempat pengambilannya, beberapa model akan melihat bagaimana peluang penembakan dibuat (umpan silang, bola melalui, serangan balik dll.) Dan analisis bagaimana tembakan dilakukan. secara lebih rinci (tembakan setelah menggiring bola berhasil, rebound setelah menyimpan dll).

pass-inarticle.jpg

Jelas, model semacam ini memerlukan lebih banyak data dan sumber daya untuk membangun dan memelihara – model xG 11tegen11 adalah salah satu contoh dari model sasaran yang diharapkan yang mempertimbangkan proses penyemprotan yang lebih luas saat menetapkan nilai xG pada gambar.

Pertahanan dampak ada pada xG

Tiga cara sebelumnya untuk memodelkan sasaran yang diharapkan semuanya melakukan pekerjaan dengan baik untuk memberikan perkiraan berapa banyak gol yang harus diharapkan tim skor dalam satu pertandingan atau sepanjang musim. Namun, ada variabel lain yang berkontribusi terhadap peluang mencetak gol potensial.

Sepak bola bukan hanya tentang menyerang. Posisi defensif dan mengurangi peluang lawan mencetak gol sama pentingnya – pembela HAM bisa memaksa pemain untuk menembak dengan cara yang berbeda atau melakukan penyesuaian menit terakhir yang membuat skor lebih sulit.

Selain menganalisis keseluruhan proses penyerangan – dari bagaimana sebuah peluang diciptakan di tempat tindakan terakhir terjadi – dengan menggunakan kedekatan pembela oposisi dan bagaimana hal itu mempengaruhi kualitas tembakan, tambahkan tingkat detail lainnya ke pemodelan sasaran yang diharapkan.

Ini berarti bahwa melihat di mana posisi penjaga gawang dan pembela berada dalam kaitannya dengan di mana tembakan diambil dapat menghasilkan keluaran tujuan yang paling akurat yang diharapkan semua.

Model harapan apa yang paling diharapkan adalah model yang paling akurat?

Sekarang kita tahu bagaimana model kerja harapan yang berbeda diharapkan, kita dapat mulai menganalisis metode mana yang menghasilkan hasil yang paling akurat. Tabel di bawah ini membandingkan selisih gol sebenarnya untuk setiap tim dari musim Liga Primer 2016/17 dan hasil selisih gol yang diharapkan dengan menggunakan berbagai model sasaran yang diharapkan yang disebutkan di atas.

Cara terbaik untuk menilai keakuratan masing-masing pendekatan ini adalah menemukan akar-mean-square deviation (RMSD) – kadang-kadang disebut sebagai root-mean-square error (RMSE). Hal ini dilakukan dengan mengkuadratkan perbedaan dalam selisih gol yang sebenarnya dan selisih gol yang diharapkan untuk setiap tim, menghitung rata-rata dan kemudian menemukan akar kuadrat rata-rata itu.

Seperti yang Anda lihat, tiga pendekatan yang berbeda sangat mirip dengan output yang mereka hasilkan dalam hal selisih gol yang diharapkan di musim Liga Champion 2016/17 – hanya 0,91 RMSD yang memisahkan ketiganya meskipun dengan berbagai tingkat data yang digunakan.

Namun, satu musim (380 pertandingan) bukanlah ukuran sampel yang cukup besar untuk menyatakan bahwa satu pendekatan lebih baik daripada yang lain dengan kepastian apapun. Selain itu, menghitung RMSD secara game-per-game lebih cenderung memberi wawasan tentang ketepatan masing-masing model dan seberapa dekat mereka untuk memprediksi jumlah gol yang dicetak dalam sebuah pertandingan.