first commit
This commit is contained in:
53
doc/decisions/ADR-001-scraper-choice.md
Normal file
53
doc/decisions/ADR-001-scraper-choice.md
Normal file
@@ -0,0 +1,53 @@
|
||||
# ADR-001: Cheerio Scraping Kütüphanesi Seçimi
|
||||
|
||||
## Durum
|
||||
|
||||
Kabul edildi
|
||||
|
||||
## Bağlam
|
||||
|
||||
Netflix içerik sayfalarından HTML parsing ile veri çekmemiz gerekiyor. İki ana seçenek var:
|
||||
|
||||
1. **Cheerio**: Lightweight HTML parser
|
||||
2. **Playwright/Puppeteer**: Headless browser automation
|
||||
|
||||
## Karar
|
||||
|
||||
**Cheerio** seçildi.
|
||||
|
||||
## Gerekçe
|
||||
|
||||
### Cheerio Avantajları
|
||||
- Hafif ve hızlı
|
||||
- Düşük kaynak kullanımı
|
||||
- Basit API
|
||||
- Daha az bağımlılık
|
||||
|
||||
### Playwright Avantajları
|
||||
- JavaScript rendering desteği
|
||||
- Daha güçlü scraping
|
||||
- Dinamik içerik desteği
|
||||
|
||||
### Seçim Nedeni
|
||||
1. Netflix sayfalarının HTML'inde temel veriler mevcut
|
||||
2. Client-side rendering gerektiren kritik veri yok
|
||||
3. Performans öncelikli
|
||||
4. Başlangıç için Cheerio yeterli
|
||||
|
||||
## Sonuçlar
|
||||
|
||||
### Olumlu
|
||||
- Düşük kaynak kullanımı
|
||||
- Hızlı yanıt süresi
|
||||
- Basit bakım
|
||||
|
||||
### Olumsuz
|
||||
- JavaScript rendering gerektiren sayfalar için çalışmayabilir
|
||||
- Netflix client-side rendering'e geçerse güncelleme gerekir
|
||||
|
||||
### Alternatif Plan
|
||||
Eğer Cheerio yetersiz kalırsa Playwright'a geçiş yapılabilir. Altyapı buna uygun hazır.
|
||||
|
||||
## Tarih
|
||||
|
||||
2025-02-27
|
||||
Reference in New Issue
Block a user