Como dice X.Cyclop no es logico ya que por lo que yo se en HTML no hay IO.
Un portal funciona muy facil y complicado:
1) Hay que tener un Spider que navegue y te haga una BD periodicamente.
2) El buscador del BD que retornara el resultado de la busqueda.
Por lo que leo pretendes hacer un programa que busque directamente desde la red y eso solo seria muy lento e incompetente.
Por lo tanto aprende un lenguaje adecuado (tienes desde Ruby hasta haskell o erlang) y luego sabras que lo que vez en Google (o Yahoo, AOL, AltaViasta...) es CGI.