La manera d’aconseguir que l’API de Google Custom Search Engine retorni en un XML en format ATOM una llista de resultats de cerca filtrats en un rang de data determinat és:
https://www.googleapis.com/customsearch/v1?key=[clau1]&alt=atom&cx=[clau2]&q=[paraules clau]&sort=date:r:20110301:20110430
On [clau1] hi va la clau API, sense els claudàtors. On [clau2] hi va el codi que identifica aquest motor de cerca personalitzat en concret, també sense claudàtors. On [paraules clau] les paraules a cercar, sense claudàtors i separades per signes +.
Finalment, on 20110301:20110430 hi ha d’anar un rang de dues dates, separades per : i en format yyyymmdd. y és l’any, m és el mes i d el dia.
A l’ajuda de Google hi ha l’explicació de com es pot obtenir una clau API de Google Custom Search Engine. El codi que va a [clau2] s’obté del tauler d’administració de Google Custom Search Engine i identifica una configuració concreta d’aquest servei.
Precisament això ho podem fer servir per obtenir resultats de qualsevol web, i no només dels llistats en un custom search engine. Per fer-ho cal seguir aquestes passes que m'(auto)copio d’un altre apunt (més detalls a Stack Overflow):
- Cal anar a la pàgina principal de Google Custom Search Engine (CSE) i fer clic al botó “Create a Custom Search Engine”.
- Escriure un nom i una descripció qualsevol per al (CSE) i posar al camp “Define your search engine” una URL qualsevol. Acceptar els termes d’ús i fer clic a següent.
- Adreçar-se al tauler de control (hi ha un botó a la part superior i si no es pot tornar a la portada de Google Custom Search Engine (CSE). Després a la secció “Basics”.
- Allà cal seleccionar “Search the entire web but emphasize included”.
Documentació
- Ajuda de Google: primeres passes amb l’API. Orienta sobre com aconseguir la clau API i altres dubtes inicials.
- Entrada al fòrum Stack Overflow sobre com crear una Custom Search Engine que contempli tots els webs, no només els llistats
- Documentació sobre el format dels rangs de dates
- Documentació sobre structured data i Page Dates tal com Google les accepta.