Questo sito contribuisce alla audience di Il Messaggero

Recensione Bright Data (ex Luminati Networks)

di

Hai un’attività per la quale hai bisogno di estrapolare i dati da alcuni siti Internet o app con una certa regolarità? Allora scommetto che ti farebbe comodo un proxy in grado di collezionare in modo sicuro, efficace e veloce i dati accessibili pubblicamente da siti esterni. Se le cose stanno così, allora credo che dovresti dare un’occhiata ai prodotti di Bright Data.

Precedentemente conosciuta come Luminati Networks (il perché del cambio di nome è facilmente intuibile con una semplice ricerca del termine “luminati” su Google, ma riflette anche l’impegno a fornire una soluzione trasparente ed etica), Bright Data è tra le più importanti società del settore e vanta una rete di proxy per aziende tra le più avanzate al mondo. Fornisce prodotti all’avanguardia per la raccolta di dati dal Web in grado di bypassare i blocchi più sofisticati e di ottenere flussi di dati affidabili su qualsiasi scala aggiornati in tempo reale, nel pieno rispetto non solo della legge, ma anche dell’etica. Consente poi di personalizzare le attività di estrazione dei dati fin nei minimi dettagli e fornisce supporto 24 ore su 24, 7 giorni su 7 in varie lingue.

Il suo fiore all’occhiello sono sicuramente i 72 milioni di proxy residenziali, compresi i proxy mobili basati su dispositivi di utenti reali, ma ci sono anche tanti altri prodotti da tenere in considerazione, ad esempio il Web Unlocker: un proxy di nuova generazione in grado di assicurare il 100% di successo grazie a un sistema intelligente di superamento dei blocchi; il tutto gestibile con comodità tramite una dashboard sufficientemente intuitiva e offerto con prezzi modulabili, adatti alle aziende di varie dimensioni. Per tutti i dettagli, continua a leggere: trovi spiegato tutto qui sotto.

Indice

Informazioni preliminari

Bright Data

Prima di parlarti in dettaglio di Bright Data e dei servizi che l’azienda offre, lasciami chiarire un attimo a cosa ci riferiamo quando parliamo di proxy.

Ebbene, un server proxy è per l’appunto un server (cioè un computer remoto) che si pone come intermediario tra un client, ad esempio il tuo computer o qualsiasi altro dispositivo tu voglia usare per accedere a Internet, e le risorse che vuoi contattare sul Web, ad esempio un sito da visitare.

Avendo questa intermediazione, il sito (o comunque la risorsa remota) che contatterai non “vedrà” il tuo reale indirizzo IP o la tua reale posizione geografica, bensì quella del server che sta facendo da intermediario. In ambito consumer, soluzioni del genere vengono usate solitamente per superare le restrizioni geografiche e le censure applicate alla navigazione online in alcuni Paesi, oppure per accedere a cataloghi esteri di servizi di streaming.

Passando all’ambito business, invece, i proxy possono essere molto utili per tutte quelle attività di estrapolazione dei dati da risorse esterne. Un esempio? Immagina di avere un sito che compara i prezzi di prodotti disponibili su vari stori online: un proxy potrebbe consentirti di estrapolare i prezzi in massa dagli store in questione — e quindi averli a disposizione per il tuo sito — senza svelare la tua identità, la tua posizione e, soprattutto, evitando i ban da parte dei sistemi anti-bot.

Da qui viene l’importanza di soluzioni come quelle offerte da Bright Data, la quale conta su una rete di proxy per aziende tra le più avanzate e stabili al mondo, con soluzioni flessibili per la raccolta dei dati dal Web in grado di bypassare anche i sistemi di blocco più sofisticati, supporto 24/7 in varie lingue e soluzioni adatte anche alle aziende più esigenti.

Oltre che dal punto di vista tecnico, Bright Data ha poi compiuto grandi sforzi anche per quanto riguarda il lato “etico” del suo operato. L’azienda, infatti, ha deciso di dire di no ai rivenditori, di limitare i casi d’uso praticabili e di rendere il processo di verifica dei clienti (KYC) estremamente accurato e preciso.

Chiaramente parliamo di una soluzione non alla portata di tutti, né dal punto di vista economico (anche se ci sono soluzioni adatte a vari tipi di scopi e aziende), né da quello pratico (visto che per usare alcuni degli strumenti offerti bisogna avere un minimo di conoscenze pregresse), ma si può star sicuri circa il livello, altissimo, del servizio garantito da Bright Data. Continua a leggere per saperne di più.

Prodotti e prezzi di Bright Data

Bright Data

A questo punto, direi di passare al sodo e di scoprire quali sono i prodotti e i prezzi di Bright Data.

Come già detto, il “pezzo forte” dell’azienda sono gli oltre 72 milioni di proxy residenziali, tra cui anche proxy mobile con uptime di 99.9%, tempi di risposta ai vertici della categoria (1.18 s) e tutto quello che serve per collezionare i dati in maniera legale, etica e con ampie possibilità di personalizzazione. È disponibile anche un’estensione per browser che permette di gestire i proxy con facilità.

Ci sono, poi, i proxy data center e altri strumenti, come il Web Unlocker, che rappresenta un proxy di nuova generazione in grado di bypassare tutti i sistemi di blocco in maniera innovativa con tassi di successo del 100%. Andiamo però con ordine e vediamo quali sono i tipi di proxy offerti da Bright Data e le loro caratteristiche principali.

  • Proxy data center — Bright Data offre una delle più ampie ed efficaci reti di proxy basate su data center. Quest’ultima è composta da oltre 770.000 indirizzi IP appartenenti a oltre 3.000 subnet di tutto il mondo, con un uptime del 100%. Rappresentano una soluzione relativamente economica, ma valida solo per estrapolare dati da fonti che non vantano sistemi di protezione particolarmente sofisticati. Essendo basate su IP di data center e non su IP residenziali (cioè di utenti reali), sono infatti più inclini a essere riconosciute e bloccate dai sistemi anti-bot. U proxy data center non ruotano di default, ma è possibile impostare delle regole di rotazione tramite il Proxy Manager di Bright Data (di cui ti parlerò meglio più avanti). Gli IP dei proxy data center si suddividono in IP condivisi (indirizzi condivisi tra più clienti, in modo da riservarsi un intervallo fisso di IP a rotazione o da acquistare degli IP condivisi individuali, con banda senza limiti) e IP esclusivi (da usare esclusivamente per i propri scopi). Da evidenziare il supporto al protocollo SOCKS5.
  • Proxy residenziali — la soluzione migliore per la maggior parte delle attività di cattura dei dati online. Una rete di proxy residenziali è formata da indirizzi IP di computer domestici reali, i quali, proprio perché identificati come computer appartenenti a utenti reali, permettono di estrapolare le informazioni dal Web senza incorrere in blocchi o ban, anche quando ci sono di mezzo sistemi di protezione particolarmente sofisticati. La rete di proxy residenziali di Bright Data è composta da oltre 72 milioni indirizzi IP reali provenienti da 195 Paesi e varie città del mondo, con un uptime del 99.9%. Questi ultimi vengono affittati o acquistati da provider di servizi Internet (ISP) per uso commerciale e si suddividono in IP condivisi (più economici ma condivisi tra più clienti) e IP esclusivi (quindi gruppi di IP residenziali ai quali si ha accesso esclusivo per le proprie esigenze di raccolta dati; ideali per determinati casi d’uso in cui possono esserci blocchi causati dall’utilizzo di IP duplicati). Maggiori informazioni qui.
  • Proxy residenziali statici — Bright Data offre anche proxy residenziali statici, con oltre 110.000 IP assegnati da ISP di tutto il mondo, i quali assicurano un uptime del 100% e zero blocchi da parte dei sistemi di protezione. Maggiori informazioni qui.
  • Proxy mobile — Bright Data ha dalla sua dei proxy mobile, cioè dei server proxy basati su dispositivi mobili di veri utenti, ideali per carpire dati da obiettivi particolarmente complessi (es. alcuni servizi o app che funzionano solo da mobile), con la possibilità di contare su oltre 7 milioni di IP in tutto il mondo sotto rete 4G/3G e di specificare la durata delle sessioni. Bright Data offre anche un’opzione per avere mobile proxy privati con 3-30 IP riservati all’azienda che ne fa richiesta. Da sottolineare, anche in questo caso, il supporto al protocollo SOCKS5. Maggiori informazioni qui.
  • Web Unlocker — si tratta della “next-gen” dei proxy, con una percentuale di successo del 100%. In poche parole, il Web Unlocker di Bright Data è un sistema automatizzato che ruota in automatico i profili di vari browser e si occupa di tutto il necessario (cookie, fingerprint e altri identificatori) per superare eventuali sistemi di blocco; dopodiché estrae e verifica la validità dei dati ricavati, in modo da fornire all’azienda un risultato sempre accurato. Può gestire persino JavaScript. È uno strumento davvero unico nel suo genere, in grado di facilitare incredibilmente la vita dell’azienda che ne fa uso (di fatto, svolge tutto il lavoro da solo). Maggiori informazioni qui.

I prezzi dei proxy residenziali partono da 25$/GB, 300$/mese (pari a 15$/GB) o 3.240$/anno (pari a 13.5$/GB) con trial di 7 giorni per le aziende e possibilità di rimborso entro 3 giorni per gli utenti individuali. È possibile pagare con PayPal, carta di credito, wire transfer, AliPay e Payoneer. Puoi avere una stima dei prezzi dei servizi di cui hai bisogno usando l’apposito calcolatore messo a disposizione da Bright Data: lo trovi qui, e c’è anche la possibilità di contattare un consulente per avere informazioni più precise prima di usare il servizio.

Bright Data

Oltre ai proxy, come detto, sono disponibili anche altri servizi interessanti, come il Search Engine Crawler: una soluzione che permette di estrarre i risultati delle ricerche fatte su vari motori di ricerca in massa. Assicura un controllo granulare sui parametri di ricerca e consente di pagare solo per le ricerche andate a buon fine. Costa 5$/CPM, 500$/mese o 5.400$/anno. Maggiori informazioni qui.

C’è poi il Data Collector, un Web scraper completo integrato con i proxy di Bright Data, il quale consente di estrarre dati da varie fonti (es. Facebook, Instagram, TikTok, Amazon e Tripadvisor) o anche degli URL personalizzati tramite dei modelli preimpostati: si sceglie uno dei modelli preimpostati, si inserisce l’URL da cui recuperare i dati e vengono dunque restituiti i dati sotto forma di file JSON, CSV o XSLX; il tutto senza dover programmare nulla lato utente: il lavoro viene svolto interamente dal Data Collector di Bright Data. È possibile anche personalizzare i preset tramite un’estensione per browser, la quale permette di selezionare manualmente gli elementi che si ritengono pertinenti all’interno dei siti Web (mostrando un’anteprima dei dati ricavati). Ma c’è anche un IDE virtuale in cui mettere mano al codice, se si è in grado di farlo. I prezzi del servizio sono pari a 5$/CPM, 500$/mese o 5.400$/anno. Maggiori informazioni qui.

Infine, va sicuramente fatta menzione delle API di Bright Data per la gestione dei proxy lato codice. Si tratta di API particolarmente complete, con controlli granulari su ogni aspetto del lavoro da svolgere e in grado di andare incontro davvero a qualsiasi esigenza, anche le più avanzate e particolari.

Come funziona Bright Data

A questo punto, direi di passare all’azione e vedere più da vicino come funziona Bright Data. Ecco, dunque, una panoramica generale sul processo di registrazione al servizio e sull’utilizzo di alcune delle sue funzioni più importanti.

Creazione account

Bright Data

Per iniziare a usare Bright Data, basta collegarsi al sito ufficiale del servizio e cliccare sul pulsante Start now, in modo da accedere al modulo di registrazione, nel quale bisogna inserire First name (nome), Last name (cognome), Work email (indirizzo email di lavoro), Company size (dimensioni dell’azienda, inteso come numero di dipendenti) e Vertical (settore di appartenenza). Una volta compilato il tutto, bisogna spuntare la casella relativa a condizioni d’uso e Privacy Policy e premere sul pulsante Create account.

Nella nuova pagina apertasi, occorre poi indicare la password da usare per accedere al servizio e andare avanti, premendo sul bottone Create account. Infine, per creare definitivamente l’account, bisogna verificare la propria identità aprendo il link di conferma che arriva via email. Si verrà poi accolti dalla procedura guidata iniziale di Bright Data, tramite la quale iniziare sùbito ad attivare i servizi di proprio interesse e completare il processo di riconoscimento per avere accesso agli stessi.

Dashboard

Bright Data

Concluso il setup iniziale, si può iniziare a lavorare con la dashboard di Bright Data, che a primo acchito può sembrare un po’ dispersiva — visti i tanti tool ai quali dà accesso — ma con il tempo risulta sicuramente comoda e funzionale: d’altronde ci sono istruzioni su cosa fare in ogni angolo della stessa ed è disponibile in tante lingue, tra cui inglese, russo, spagnolo, portoghese e cinese.

Dalla dashboard è possibile gestire ogni aspetto di Bright Data a 360 gradi, con la possibilità di avere una panoramica completa del proprio profilo e dello stato del servizio (è possibile vedere il tempo di attività di ciascun servizio in tempo reale e ricevere notifiche via e-mail se qualcosa smette di funzionare temporaneamente), di gestire piani e pagamenti, regolare impostazioni e dettagli del proprio account, impostare e autorizzare i proxy, visualizzare statistiche di utilizzo e richiedere assistenza al supporto.

A proposito delle statistiche, quelle fornite da Bright Data meritano davvero una menzione particolare: ci sono, infatti, grafici visivi molto facili da consultare che supportano opzioni di filtraggio molto granulari sia in termini di periodi di tempo da prendere in considerazione (ad esempio è possibile analizzare le statistiche delle ultime ore e quelle di anni precedenti), sia come metriche (utilizzo della larghezza di banda, richieste, IP utilizzati, tasso di errore ecc.); il tutto con la possibilità di analizzare i dati complessivi o dei singoli servizi offerti e di collegare il Proxy Manager, che consente un tracciamento ancora più granulare. Basta usare le caselle di controllo e i menu a tendina relativi a ciascun grafico e, in pochi clic, si ottengono istantaneamente le informazioni delle quali si ha bisogno.

La sicurezza è un altro punto forte di Bright Data, che consente di tenere sempre sotto controllo accessi e zone (con avvisi in caso di accessi non identificati), e supporta l’autenticazione a due fattori (2FA) per rendere sempre più sicuro l’account ed evitare compromissioni o furti di identità.

Il tutto è facilmente accessibile dalla barra laterale di sinistra. Entrando più nello specifico, selezionando la voce Dashboard è possibile accedere alla dashboard con tutti i propri servizi e le relative statistiche; andando su Proxies è possibile impostare i proxy; Data Collector dà accesso ai tool per estrarre dati da Facebook, Instagram, YouTube, Twitter, TikTok, Amazon e tantissimi altri siti; API & Integrations fornisce accesso alle API e alle estensioni per integrare Bright Data in vari servizi; selezionando la voce Proxy manager è possibile accedere al Proxy manager di Bright Data per gestire in maniera unificata tutti i proxy; Proxy Chrome Extension permette di installare l’estensione per Chrome di Bright Data, mentre nel Support center ci sono tutte le opzioni per contattare il supporto di Bright Data.

Spostandosi in fondo alla barra laterale ci sono poi le icone per visualizzare lo stato del servizio, accederei ai messaggi, visualizzare la Knowledge base, gestire le impostazioni del proprio account e piani e pagamenti. Come detto, c’è davvero tutto il necessario, che è sempre a portata di clic.

Impostazione e gestione dei proxy

Bright Data

Per impostare i proxy in Bright Data, bisogna creare una cosiddetta zona. Per procedere in tal senso, bisogna dunque selezionare l’icona dedicata ai Proxy dal menu laterale della dashboard, dopodiché bisogna cliccare sul pulsante Add Zone e bisogna indicare il tipo di proxy da utilizzare (es. proxy residenziale o mobile).

In seguito bisogna digitare il nome da assegnare alla zona, scegliere un piano tariffario e un tipo di IP (condivisi o esclusivi) tra quelli disponibili, aggiungere eventuali autorizzazioni aggiuntive (es. Country, State, City e ASN), indicare eventuali porte aggiuntive da usare oltre a quelle HTTP/HTTPS e confermare la creazione della zona, premendo sul pulsante Add Zone. Per rendere la scelta più semplice, c’è una casella di testo, in alto, dove digitando l’indirizzo del sito da cui estrapolare i dati si ottengono suggerimenti automatici sui migliori proxy da usare.

Una volta creata la zona, se necessario, bisogna passare per il processo di approvazione di Bright Data che, come detto, ha un KYC molto restrittivo. Ad ogni modo, fornendo tutte le informazioni richieste si riesce a ottenere rapidamente accesso a tutti gli strumenti di cui si ha bisogno.

Il passaggio successivo, una volta attivata la zona, consiste nell’integrare i proxy con il solito codice hostname:porta, ma nella dashboard di Bright Data ci sono anche esempi di codice dinamico per tutti i principali linguaggi di programmazione. È possibile anche ottenere codici avanzati con opzioni relative al risolutore dei DNS o all’user agent da usare.

Accedendo alla sezione Proxy della dashboard è inoltre possibile modificare i parametri, visualizzare le statistiche o cancellare i propri proxy usando le icone che compaiono in loro corrispondenza al passaggio del mouse.

E per la gestione dei proxy? In questo caso, viene in aiuto Proxy Manager: un ottimo software open source disponibile per Windows, macOS e Linux per la gestione semplificata delle reti proxy di Bright Data. Fornisce log dettagliati aggiornati in tempo reale con le attività dei proxy, permette una migliore gestione delle impostazioni di rotazione rispetto al pannello Web, permette di abilitare il protocollo SOCKS5 (ove supportato) e consente di usufruire della funzione Proxy Waterfall. Quest’ultima fa sì che quando si esegue una richiesta a un sito Web, questa passi prima attraverso la rete proxy meno efficace (ed economica), dopodiché, in caso di fallimento, sposta la richiesta su proxy più avanzati e costosi: si tratta di una buona soluzione, ma bisogna contare che rallenta il processo di estrazione dei dati e richiede, ovviamente, l’attivazione di più reti di IP contemporaneamente. Ma l’elenco delle sue funzioni potrebbe andare avanti ancora a lungo: il mio consiglio è quello di scaricare il programma e divertirsi a esplorarne tutte le caratteristiche. Maggiori informazioni qui.

Supporto Bright Data

Bright Data

Nel caso avessi bisogno di maggiori informazioni sui prodotti di Bright Data o di supporto diretto, puoi contare su tantissime risorse messe a disposizione dalla stessa Bright Data.

Se vuoi approfondire il funzionamento dei prodotti, puoi dare un’occhiata alle FAQ ufficiali, dove ci sono le risposte alle domande più frequenti degli utenti; oppure puoi guardare i webinar di Bright Data che illustrano in formato video e testuale come muovere i primi passi con Bright Data, come installare e usare Proxy Manager e molto altro ancora.

Se, invece, già usi Bright Data e necessiti di aiuto diretto, puoi contare su un servizio di supporto 24/7 disponibile in varie lingue. Ad esempio, puoi usufruire della live chat con tempi di risposta garantiti in 25 minuti e del sistema di ticket (accessibile dalla sezione Support Center della dashboard) per risolvere i tuoi dubbi e problemi nel più breve tempo possibile. Il supporto è disponibile anche via telefono, email e WhatsApp.

Articolo realizzato in collaborazione con Bright Data.

Salvatore Aranzulla

Autore

Salvatore Aranzulla

Salvatore Aranzulla è il blogger e divulgatore informatico più letto in Italia. Noto per aver scoperto delle vulnerabilità nei siti di Google e Microsoft. Collabora con riviste di informatica e cura la rubrica tecnologica del quotidiano Il Messaggero. È il fondatore di Aranzulla.it, uno dei trenta siti più visitati d'Italia, nel quale risponde con semplicità a migliaia di dubbi di tipo informatico. Ha pubblicato per Mondadori e Mondadori Informatica.