
Nova ferramenta busca dados em mais de 500 milhões de sitesNo meio da corrida entre a Google, a Microsoft e o Yahoo! pelos mais altos postos no ranking de buscas, e com o ainda tímido WolframAlpha, pesquisadores da Universidade de Washington começam a testar mais uma ferramenta de busca, que rastreia relacionamentos entre palavras em mais de 500 milhões de sites da internet. Seu nome: TextRunner. » Judeus ortodoxos lançam ferramenta de busca "kosher" Segundo o site Technology Review, do MIT, alguns especialistas já afirmam que o TextRunner será a base para uma nova geração de buscas mais inteligentes na web, na qual lotes de informação serão primeiramente recolhidos e então combinados de forma consistente. A diferença do TextRunner para os outros buscadores é que ele se baseia no relacionamento entre duas ou mais palavras. A combinação "mata bactéria" leva a resultados como "calor mata bactéria" ou "luz ultravioleta mata bactéria", resultados chamados triplos que permitem à ferramenta prever o texto e visitar a página da qual vieram as informações. Além disso, ele funciona sozinho e aprende sozinho. Se encontra a sentença "mamíferos têm sangue quente" e "cachorros são mamíferos", a ferramenta logo deduz que cachorros devem ter sangue quente. "A importância do TextRunner está no fato de ser escalável porque não tem supervisão", explica Peter Norvig, diretor de pesquisa do Google, que doou ao projeto a imensa base de dados de sites usada pela empresa, para que a nova ferramenta possa analisar e ser testada, noticiou o site Slashdot. "Ela pode descobrir e aprender milhões de relações, mais de uma ao mesmo tempo", completa. Norvig explica que as antigas ferramentas de busca precisavam de instruções do programador. Por exemplo, para encontrar nomes de CEOs em milhões de documentos, você primeiro precisa treinar o software com outros exemplos, como "Steve Jobs é CEO da Apple" e "Sheryl Sandberg é CEO do Facebook". "Com o TextRunner, não há humanos no loop: ele acha relações sozinho" diz o diretor, que afirmou também que o Google já possui um projeto similar. Segundo Oren Etzioni, cientista computacional da Universidade de Washington e líder do projeto, a primeira versão da ferramenta é apenas um protótipo e não é destinada ao público, servindo apenas para demonstrações da extração automatizada de informações dos milhões de websites. Porém, para os interessados em conhecer o início dessa ferramenta, basta acessá-la pelo endereço tinyurl.com/textrunner. A interface ainda é bem primária, com a cara dos primeiros sites da internet, mas um clique em um dos exemplos disponíveis já mostra o poder de sua busca. Com um olhar bem científico, a ferramenta permite procurar por termos através de argumentos, predicados e questões inteiras formuladas, como "Quem foi presidente dos Estados Unidos?". O resultado é apresentado de forma muito organizada, com hyperlinks que rapidamente levam a composições alternativas de texto, descrições e outros links. Uma busca básica por um dos exemplos, a pergunta "Quem construiu as pirâmides", em vez de levar a um único e óbvio resultado, leva a 36, cada qual com o número de fontes na frente. Outros tópicos, resultantes de outras relações de palavras como "podem ter construído", "pararam de construir" e "não construíram" também são listados da mesma forma. O TextRunner se assemelha, de certa forma, ao recentemente festejado WolframAlpha, e por enquanto parece mostrar de maneira um pouco mais crua suas fontes, em uma interface temporariamente tosca, lembrando um pouco os resultados atuais do próprio Google. TOPO Geek |
Brasileiros com acesso à web chegam a 44,5 milhões em maioO número de brasileiros que tem acesso à internet em casa ou no trabalho atingiu os 44,5 milhões em maio, enquanto o de usuários ativos ficou em 34,5 milhões, informou nesta segunda-feira a empresa de pesquisa de mercado Ibope Nielsen Online. Segundo a companhia, o Brasil continuou primeiro colocado no mundo em tempo de navegação, com 40 horas e 41 minutos em maio. A França registrou 34 horas e cinco minutos, seguida pela Espanha, com 32 horas e 23 minutos; e por Alemanha, com 30 horas e 20 minutos. "Esse tempo mantém o Brasil na liderança também quando se junta a navegação residencial com a do trabalho", afirma em relatório José Calazans, analista de mídia da empresa de pesquisa. A quantidade de pessoas com acesso à rede apenas em casa alcançou 40,1 milhões em maio. Dentre estes, 25,6 milhões se conectaram à internet no mês passado. A empresa projetou ainda em 62,3 milhões o número de brasileiros com 16 anos ou mais de idade que possuem acesso algum tipo de acesso à web, seja no trabalho, em casa, escolas, lan houses, bibliotecas ou telecentros. TOPO Reuters |
Serviço de backup online ajuda a achar ladrão de notebookA internet já ajudou muitas pessoas a recuperarem pertences roubados, das formas mais incomuns. Na mais recente, um homem recuperou seu notebook roubado com a ajuda de um programa de backup online, que registrou imagens do ladrão, tiradas com a webcam do computador. » Ladrão de laptop é detido após se cadastrar em site pornô O blog de Bruce Perens, conhecido programador, evangelista do software livre e criador da definição de Open Source, divulgou um artigo assinado por um policial do escritório de polícia de Berkeley, Casimiro Pierantoni. Nele, Pierantoni informa que prender um arrombador de carros significa diminuir consideravelmente o número de roubos em uma comunidade, uma vez que uma única pessoa pode cometer vários crimes em um mesmo dia, e relata a história do ladrão pouco esperto. Um homem teve seu carro arrombado e seu notebook levado na cidade de Berkeley, Califórnia, Estados Unidos no último dia 5. Já dando como perdido seu computador, a vítima foi conferir seu serviço eletrônico de backup, para recuperar ao menos suas informações. E, para sua surpresa, viu fotos do ladrão, tiradas com a webcam do notebook, armazenadas em sua conta no serviço. Então, as fotos foram levadas a detetives da polícia local, que reconheceram o suspeito, de nome Vega, que havia sido solto no início do ano. Além disso, conseguiram identificar o ambiente, que parecia ser o quarto de um motel, e iniciaram o rastreamento do endereço IP do local. Antes da identificação precisa do local pelo IP, policiais localizaram um homem entrando em um carro em um estacionamento de um motel em Oakland e o prenderam. No carro e no quarto do motel, os policiais encontraram não só o notebook roubado, mas também outros objetos, frutos de roubos variados. Vega e a namorada foram presos. TOPO Geek |
Nova ameaça circula na internet, alertam especialistasUm novo ataque apelidado de Gumblar surgiu na internet em março, mas só agora começou a ser visto pelos especialistas como uma ameaça ainda mais perigosa que o Conficker, que segundo estimativas fez mais de dez milhões de vítimas ao redor do mundo. » Vírus Conficker contamina 50 mil PCs por dia Segundo o site ZDNet, o ataque se aproveita da baixa segurança em sites legítimos para instalar código malicioso que, uma vez rodados em um computador vulnerável, é capaz de baixar novos malwares para a máquina e roubar senhas de acesso FTP a outros sites. Os scripts maliciosos são dispostos em sites vulneráveis e tentam explorar falhas na ferramenta Adobe Reader e Flash Player. Quando uma busca é feita no mecanismo Google a partir de uma máquina infectada, diversos resultados falsos são apresentados levando a vítima a outros sites de malware. Em março, o Gumblar utilizava apenas um domínio para envio de malware, gumblar.cn, que apesar de hospedado na China está associado a endereços IP da Rússia e Letônia. Hoje, os malwares acessados pelas máquinas das vítimas do ataque se hospedam em diversos outros domínios. O receio é semelhante ao que elevou o Conficker ao status de uma das maiores ameaças de todos os tempos na web: que estas máquinas comprometidas pelo malware venham a fazer parte de uma gigantesca botnet, rede de computadores controlados remotamente por cibercriminosos para fins ilegais como envio de spam e derrubada de servidores. A firma ScanSafe afirmou que 37% de todo malware que bloqueou com seu software de segurança durante as duas primeiras semanas de maio foram de responsabilidade do Gumblar, e levavam à interceptação de tráfego da web e instalação de trojans para roubos de nomes de usuários e senha. O roubo de senhas FTP que possam estar em máquinas comprometidas também aumenta o risco do malware ser distribuído para muitos outros domínios, dificultando o trabalho das firmas de segurança. O Gumblar também pode evitar a lista de sites bloqueados no Google Chrome, explicou o site Digital Trends, acrescentando que a Sophos, outra empresa de segurança, teria noticiado que 42% de todos os códigos maliciosos encontrados em websites atualmente estão ligados ao ataque. TOPO Geek |
Novo site de buscas dá respostas diretas a internautasUm novo site de busca pela internet que irá concorrer com o Google foi lançada nesta segunda-feira. Diferentemente de outros buscadores, o site WolframAlpha foi idealizado para dar respostas diretas às perguntas dos internautas em vez de encaminhá-los a uma lista de sites que contenham a informação. » Resenha: esperada "máquina de respostas" tem falhas A nova ferramenta se define como "motor de conhecimento computacional" porque busca por informações e dados e não por sites. O novo sistema foi criado em abril pelo físico britânico Stephan Wolfram e, desde então, vem sendo testado pelo público. Ao lançar uma busca pela temperatura do momento na cidade do Rio de Janeiro, o site não apenas informa quantos graus está fazendo na capitalfluminense, como também apresenta um gráfico com o clima na cidade nos últimos dias e traz a previsão do tempo para as próximas 48 horas. Acesso a informação A ferramenta de busca ainda soluciona equações matemáticas complicadas e organiza estatísticas. Durante uma demonstração no Centro Berkman de Internet e Sociedade da Universidade de Harvard, nos Estados Unidos, Wolfram disse que o grande objetivo do site é "tornar conhecimento especializado acessível para todos a qualquer lugar e a qualquer hora". O britânico minimizou rumores de que o sistema poderia "aniquilar" o Google e definiu sua criação como uma forma para que as pessoas possam aproveitar o máximo das informações que obtêm pela rede. TOPO BBC Brasil |