Datasets no Brasil

Estão começando a surgir no Brasil iniciativas para real transparência no acesso aos dados do governo. A estruturação dos dados em formatos abertos (RDF, CSV etc), acompanhados de metadados e indexados em interfaces de busca e navegação que facilitem o download dos arquivos são para mim as condições necessárias para o livre acesso à informação. Uma destas iniciativas é o LeXML. Nos EUA existem os projetos data.gov e datasf.org.

Na linha oposta, estão serviços como o da ANP de levantamento de preços de combustíveis. Que tipo de pesquisa pode ser feita com estes dados? Para começar, só a construção de um datasets a partir deste site demanda um bom trabalho de desenvolvimento de um crawler e transformadores. Afinal, eu me pergunto, qual é o objetivo deste site da ANP? Se for para um cidadão comum pesquisar qual o melhor posto para abastecer seu carro, a interface deixa a desejar. Se for para a sociedade acompanhar os preços de combustíveis no Brasil, isto implica acessibilidade as séries de dados, e todos meus comentários anteriores fazem sentido, não?