Hotelen Clustering-a
Sarrera 
Clustering aplikazioa tresna bat da Euskal AEko establezimenduak taldekatzen dituena eguneroko prezioak erabiliz. Prezio horiek jasoak izan dira web scraping metodoak erabiliaz hotel-establezimenduetan gela-erreserbak eskaintzen dituzten plataformetan..
Eguneroko prezioak lortzeko, egun bakoitzean 120 kontsulta egin dira establezimendu bakoitzeko; alegia, egun eta hotel/ostatu bakoitzeko hurrengo 120 egunen prezioak eskatu dira. Behin prezioak eskuraturik, egun bakoitzeko 120 prezio posible horietarik horien guztien mediana hartu da analisirako.
Cluster- eta iragazki-aukeraketa
Aplikazioaren goialdeko 4 hautagailuak 2 ataletan dira nagusiki banatzen:
- Cluster-a: hautagailu honen bidez aukera daiteke erakuts dadin cluster bakar bat edo denak batera. Denak aukera hartuz gero, lehen grafikoan talde guztiak agertuko dira, eta beste grafikoek establezimenduen datu absolutuak erakutsiko dituzte kategoria eta geruzen arabera bereizirik. Bestalde, cluster zehatz bat hartuz gero, cluster hori margotuko da eta talde horri dagozkion hotelen portzentajea berriz kategoriaren eta geruzaren arabera bereizia.
- Kategoria, Lurraldea eta Geruza: 3 hautagailu horiek iragazki soilak dira establezimenduei ezarri ahal zaizkienak.
Clustering-mota 
Grafikoak aukera ematen du hartzeko aplikazio honetarako eginiko clustering-mota.
- Prezio Absolutuak: establezimenduak taldekatuak izan dira jatorrizko prezioak erabiliaz. Helburua da hotelak eta ostatuak taldekatzea hainbat prezio-barruti eta joeraren arabera.
- Prezio Normalizatuak: clustering honetarako hotelen prezioak normalizatu dira 0-100 artean helburuarekin prezioetan denborazko joera ezberdinak atzitzeko. Batetik, prezio konstanteak dituztenak daude edo ia konstanteak, zeinei 100eko balioa eman zaien, eta bestetik prezioak aldatzen dituztenak urtearen garaiaren arabera edo jaiegunen arabera.
- Hegakortasuna:: kasu honetan ikertu da prezioaren aldaketa egunero egiten dena. Horretarako, R-ko TTR-ko liburutegiko gidaliburuan oinarrituriko close-to-close estimator izenekoa erabili da.
Lehen 2 kasuetan, prezioen denborazko serien clustering-a egin da distantzia euklidearra erabiliz,
probatu ondoren hainbat distantzia TSdist, TSclust eta dtw bezalako liburutegietan.
Hotelen Banaketa Kategoriaren arabera 
Izen horixe duen barra-diagramak kategorien arabera ditu banakatzen hotelak. Cluster hautagailuan aukeratzen denaren arabera, esanahia apur bat aldatuko da.
-
Denak aukera hartuz gero Cluster hautagailuan, diagramak erakutsiko ditu establezimendu guztiak lortu zirenak web scraping-aren bidez kategoriaren arabera banakatuak. Alegia, datu absolutuak dira marrazten.
- Aldiz, cluster zehatz bat aukeratzen bada Cluster hautagailuan, diagramak portzentajezko datuak ditu erakusten. Kasu honetan ageri dena da aukeraturiko cluster-ari dagozkion hotel eta ostatuen portzentajea.
Hotelen Banaketa Geruzaren arabera 
Izen horixe duten mapak eta barra-diagramak 11 geruza ezberdinetan dituzte hotelak banakatzen. Cluster hautagailuan aukeratzen denaren arabera, esanahia apur bat aldatuko da.
-
Denak aukera hartuz gero Cluster hautagailuan, diagramak eta mapak erakutsiko dituzte establezimendu guztiak lortu zirenak web scraping-aren bidez geruza geografikoaren arabera banakatuak. Alegia, datu absolutuak dira marrazten.
- Aldiz, cluster zehatz bat aukeratzen bada Cluster hautagailuan, diagramak eta mapak portzentajezko datuak dituzte erakusten. Kasu honetan ageri dena da aukeraturiko cluster-ari dagozkion hotel eta ostatuen portzentajea.
Teknika 
Tresna honek Leaflet (mapa sortzeko) eta
plotly (denborazko serieak eta barra-diagramak egiteko) liburutegiak erabiltzen ditu. JavaScript erabiltzeak interaktibitatea ahalbidetzen du; hortaz, JavaScript aukera gaitua izan behar da zure nabigatzailean.