Files
ratebubble/doc/decisions/ADR-001-scraper-choice.md
2026-02-28 02:44:41 +03:00

1.1 KiB
Raw Permalink Blame History

ADR-001: Cheerio Scraping Kütüphanesi Seçimi

Durum

Kabul edildi

Bağlam

Netflix içerik sayfalarından HTML parsing ile veri çekmemiz gerekiyor. İki ana seçenek var:

  1. Cheerio: Lightweight HTML parser
  2. Playwright/Puppeteer: Headless browser automation

Karar

Cheerio seçildi.

Gerekçe

Cheerio Avantajları

  • Hafif ve hızlı
  • Düşük kaynak kullanımı
  • Basit API
  • Daha az bağımlılık

Playwright Avantajları

  • JavaScript rendering desteği
  • Daha güçlü scraping
  • Dinamik içerik desteği

Seçim Nedeni

  1. Netflix sayfalarının HTML'inde temel veriler mevcut
  2. Client-side rendering gerektiren kritik veri yok
  3. Performans öncelikli
  4. Başlangıç için Cheerio yeterli

Sonuçlar

Olumlu

  • Düşük kaynak kullanımı
  • Hızlı yanıt süresi
  • Basit bakım

Olumsuz

  • JavaScript rendering gerektiren sayfalar için çalışmayabilir
  • Netflix client-side rendering'e geçerse güncelleme gerekir

Alternatif Plan

Eğer Cheerio yetersiz kalırsa Playwright'a geçiş yapılabilir. Altyapı buna uygun hazır.

Tarih

2025-02-27