Kasutaja-agent Parser
Parsige mis tahes kasutajaagendi stringi brauseri, OS-i, seadme tüübi ja renderdusmootori tuvastamiseks. Tasuta, kohene ja täielikult kliendipoolne.
Parsige mis tahes kasutajaagendi stringi brauseri, OS-i, seadme tüübi ja renderdusmootori tuvastamiseks. Tasuta, kohene ja täielikult kliendipoolne.
User-Agent string on HTTP päis, mille brauserid ja teised kliendid saadavad serveritele enda tuvastamiseks. Algselt lühike identifikaator, kaasaegsed kasutajaagendid on laialivalguvad ajalooliste versioonistringide konkatenatsioonid, mis on loodud tagasiühildumiseks saitidega, mis otsivad konkreetseid brausereid. Tüüpiline Chrome'i kasutajaagent viitab tänapäeval Mozillale, AppleWebKitile, KHTML-ile, Geckole, Chrome'ile ja Safarile – enamik neist on tühised.
Kasutajaagendi sõelumine eraldab sellest tihedast stringist tegeliku brauseri, versiooni, OS-i ja seadme tüübi. Andmed teavitavad analüüsist, funktsioonide tuvastamisest ja roboti tuvastamisest. See on ka ebatäiuslik – kasutajaagendid võivad olla võltsitud, tegelikust brauserimootorist valesti kujutatud või tegelikkusest maha jäänud (iOS-i Chrome teatab kui Safari, kuna kõik iOS-i brauserid peavad kasutama WebKiti).
See parser kasutab mustrite sobitamist tavaliste brauserite, operatsioonisüsteemide ja seadmekategooriate tuvastamiseks kasutajaagendi stringist. Väljund sisaldab brauseri nime ja versiooni, operatsioonisüsteemi ja versiooni, seadme tüüpi (lauaarvuti, mobiil, tahvelarvuti, robot) ja renderdusmootorit. Sõelumine toimub teie brauseris; andmeid ei saadeta kuhugi.
Analüüsi, silumise ja turvalisuse töövood saavad kasu kasutajaagendi töötlemata stringidest struktureeritud andmete eraldamisest. Miljoneid kasutajaagente sisaldavad serverilogid muutuvad jälgitavaks, kui igaüks sõelutakse brauseri/OS-i/seadme väljadele. Veaaruannetes, mis sisaldavad kasutajaagendeid, on lihtsam tegutseda, kui näete kiiresti, milline brauser ja versioon on seotud.
Boti tuvastamine tugineb ka kasutajaagendi sõelumisele esimese signaalina. Paljud roomajad tuvastavad end ausalt (Googlebot, Bingbot, GPTBot); teised võltsivad Chrome'i, kuid sisaldavad peeneid vihjeid. Parsimine aitab neid mustreid pinnale tuua.
Kleepige kasutajaagent, vaadake struktureeritud andmeid.
Kasutaja-agendi sõelumine on põhimõtteliselt mustri sobitamine suure regex-reeglite raamatukoguga. Brauseri tuvastamine kasutab alamstringe (Chrome, Firefox, Safari, Edge), OS-i tuvastamine otsib platvormi märke (Windows NT 10.0, Mac OS X, Linux, Android, iPhone OS) ja seadmete tuvastamine ühendab OS-i vormiteguri vihjetega.
Parsimisel tuleb järjestada. Edge'i kasutajaagendid hõlmavad Chrome'i ja Safari märke, seega peab Edge'i kontrollimine toimuma enne Chrome'i. Brave, Vivaldi ja Opera ühendavad Chromiumi ja neil on sarnased probleemid. Täiskasvanud sõelumisteekid (ua-parser-js, ua-parser) säilitavad reeglite loendid, mis on järjestatud õigeks täpsustuseks.
User-Agent Client Hints (UA-CH) on kaasaegne asendus: struktureeritud Sec-CH-UA päised asendavad pärand User-Agenti. Brauserid külmutavad järk-järgult pärandstringi ja lähevad üle UA-CH-le. Uus sõelumine peaks mõlemat toetama.