BLACK

Filtro anti-spam criado na Unicamp supera todos os competidores

Isabel Gardenal - Jornal da Unicamp - 16/09/2010

Em 2008, internautas brasileiros enviaram 2,7 trilhões de spams. No primeiro bimestre deste ano, o país passou à primeira posição no ranking mundial, após ter sido responsável por 7,7 trilhões somente em 2009.
"Isso é lamentável, porque não dispomos de respaldo jurídico contra esse tipo de fraude. Com isso, a situação tende a se agravar", prevê o pesquisador Tiago Agostinho de Almeida.
Tecnólogo em computação, Tiago desenvolveu em sua tese doutorado, defendida na Unicamp, um filtro para classificar automaticamente mensagens de e-mail: o MDL-CF Spam Filter.
Filtro anti-spam
O novo filtro, um método computacional que classifica os e-mails como spam ou como e-mail legítimo, deriva de duas técnicas: MDL (Minimum Description Length - Princípio da Descrição mais Simples) e CF (Confidence Factors - Fatores de Confidência).
O objetivo era oferecer uma classificação balanceada proporcionando uma alta taxa de bloqueio de spams e, simultaneamente, tomando os cuidados necessários para evitar classificação incorreta de um e-mail legítimo. "A nossa técnica mostrou-se simples, eficiente e rápida. Seus resultados indicam que ela é superior aos melhores filtros anti-spam que existem," garante Tiago.
Na maioria dos casos, os próprios servidores de e-mail oferecem filtros anti-spam, como o GMail, o Hotmail e o Yahoo. Entretanto, a sua eficácia depende diretamente dos seus usuários. "É preciso saber usar corretamente a ferramenta oferecida pelo gerenciador de e-mails. Se souberem, a eficácia pode chegar a 95%", garante o pesquisador.
Ele explica que o maior desafio dos filtros anti-spam é não classificar um e-mail legítimo como spam. Isso é considerado um erro grave, pois a mensagem acaba sendo enviada para a caixa de spams. "Os prejuízos podem ser enormes, pois o usuário pode não tomar conhecimento de uma informação muito importante."
Campeonatos de spam
O tecnólogo simulou campeonatos de spams com base em modelos existentes. Ele explica que grandes corporações como Google e Microsoft, com frequência, financiam estes eventos para avaliar os filtros anti-spam. No estudo de Almeida, foram simuladas três competições em que concorreram o filtro proposto contra 13 métodos consagrados.
"O MDL-CF obteve o melhor desempenho. Em uma situação real, ele teria sido tricampeão. O nosso filtro teve um melhor desempenho em relação aos métodos comparados, mesmo aqueles que partem de grandes corporações, que recebem um alto investimento e que têm uma grande equipe dando-lhes suporte", comemora ele.
O pesquisador pretende oferecer plug-ins para possibilitar uma maneira simples e eficaz de empregar o filtro MDL-CF em conjunto com os principais gerenciadores de e-mail disponíveis, como o Microsoft Outlook e o Mozilla Thunderbird. "Vamos tentar desenvolver os plug-ins e oferecê-los gratuitamente como uma forma de fazer com que o fruto dessa pesquisa seja usufruído pela sociedade", almeja.
Um único spam pode danificar o equipamento, pelo fato de muitas vezes vir acompanhado de vírus. A dica de Almeida é sempre verificar os e-mails de maneira consciente. "É preciso ter um filtro anti-spam instalado ou ainda usar os recursos anti-spam oferecidos pelo provedor. Além do filtro, existem outras ferramentas que devem ser empregadas para aumentar a segurança dos usuários, como um antivírus e um firewall, um programa que bloqueia acessos", aconselha.
Prejuízos dos spams
Os spams são enviados pelos spammers, pessoas que geralmente estão interessadas na comercialização de produtos. Existem também aqueles cuja intenção é prejudicar os usuários mediante o roubo de senhas, seja de alguma informação pessoal e até mesmo do uso do seu computador para enviar spams, uma prática que vem aumentando no Brasil.
Uma das consequências dos spams é que eles envolvem um custo elevado, difícil de ser calculado. Relaciona-se inclusive à perda da produtividade de funcionários nas empresas, que gastam o seu tempo lendo e apagando mensagens não solicitadas. O conteúdo é bastante abrangente. Fora os casos de transmissão de vírus, eles permeiam propagandas, pornografia, boatos, esquemas de enriquecimento ilícito e mensagens religiosas. Existem duas formas mais corriqueiras de se apropriar dos dados pessoais dos usuários.
Numa delas, o usuário se cadastra numa empresa idônea, o qual comercializa as informações de seus consumidores para os spammers. Outra é realizada através de um arquivo chamado cookie, que armazena as informações trocadas entre o navegador e o servidor.
Ao informar o endereço de e-mail mediante esses cookies, o site poderá usar aquela informação e vendê-la. "Existe uma máfia de compra e venda nesta direção", constata Almeida, e é muito difícil chegar à fraude. "O e-mail é uma presa fácil de ser burlada. Quem envia o spam não necessariamente é aquela pessoa. Os endereços que eles enviam em geral são inválidos."
Legislação contra os spams
Em alguns países há legislações que criminalizam o envio de spams. Os exemplos mais significativos são os Estados Unidos e países da Comunidade Europeia. Ambos têm meios legais e diferentes de condenar o envio de spams.
Nos Estados Unidos, o método adotado permite que o spam seja enviado desde que ele respeite algumas regras. Dentre elas, o endereço de e-mail do remetente deve ser verdadeiro e a mensagem deve conter um mecanismo explícito para que o usuário solicite nunca mais recebê-lo. "O que acontecer fora disso, é considerado ilegal. Se conseguirem pegar o spammer, ele poderá ser multado ou, até mesmo, preso", revela o tecnólogo.
Já na Europa, o método adotado não permite que o spammer envie qualquer tipo de mensagem sem o consentimento prévio do usuário. "Se enviar um primeiro spam que seja, ele já estará cometendo uma infração."
No Brasil, a realidade é outra. "Apesar de a situação ser alarmante, não existe uma regulamentação jurídica específica com relação ao spam", relata Almeida, enfatizando a urgência de uma medida que impeça essa prática.
O volume de spams vem crescendo de forma surpreendente no Brasil, diz o tecnólogo, em princípio porque o número de usuários está aumentando e muitos utilizam o computador de maneira desprotegida. Portanto, apesar de o país ser um grande emissor de lixo virtual, não significa que ele tenha o maior número de spammers, e sim que os usuários, por falta de conhecimento, acabam sendo alvos de spammers de outros países. O pesquisador também destaca que uma das estratégias mais utilizadas pelos spammers é "sequestrar" computadores de usuários comuns e utilizá-los para enviar mais spams.
Carne enlatada originou termo spam
Existem diversas versões a respeito da origem da palavra spam. A mais aceita afirma que o termo originou-se da marca SPAM, um tipo de carne enlatada da Hormel Foods Corporation, e foi associado ao envio de mensagens não solicitadas devido a um quadro do grupo humorístico inglês Monty Phython.
O episódio ironiza o racionamento de comida ocorrido na Inglaterra durante a Segunda Guerra Mundial. SPAM foi um dos poucos alimentos excluídos desse racionamento, o que eventualmente levou as pessoas a enjoarem do produto.
Esse quadro envolve um casal discutindo com uma garçonete em um restaurante a respeito da quantidade de SPAM presente nos pratos. Enquanto o casal pergunta por um prato que não contenha a carne enlatada, a garçonete repete constantemente a palavra SPAM. Eventualmente, a discussão faz com que um grupo bizarro de vikings, presente no local, comece a cantar "SPAM, amado SPAM, glorioso SPAM, maravilhoso SPAM!", "impossibilitando qualquer tipo de conversa, assim como o spam atrapalha a comunicação por e-mail", compara Almeida.
Vítimas dos spams
As maiores vítimas dos spams são pessoas que possuem endereços de e-mail bastante divulgados, como presidentes de grandes corporações. Alguns exemplos são o dono do domínio acme.com, Jef Poskanzer, e o empresário co-fundador da empresa de tecnologia Apple Inc, Steve Jobs.
De acordo com o presidente-executivo da Microsoft, Steve Ballmer, em matéria veiculada na BBC News, o fundador da Microsoft - Bill Gates - recebe em média 4 milhões de e-mails por ano, sendo a grande maioria spams.
Curiosamente, Poskanzer recebia já em 2005 cerca de 1 milhão de spams por dia, quase 100 vezes mais que Bill Gates. "Sem os filtros anti-spam, provavelmente o sistema de e-mail não seria mais suportável", comenta Almeida.
O fato é que os spams são um negócio lucrativo, isso porque o e-mail é uma forma de comunicação muito barata e que atinge muitas pessoas simultaneamente. Desta forma, os spammers conseguem obter lucro mesmo que a taxa de resposta dos usuários seja baixa. Um estudo recente mostrou que mesmo um índice de resposta de 1 para cada 12,5 milhões de e-mails enviados ainda consegue gerar bons lucros aos spammers.
Em 2002, o mundo todo recebia em média 860 milhões de spams por dia. Para 2010, a Cisco Systems, empresa de segurança computacional, estimou que, em média, cerca de 300 bilhões de spams serão enviados diariamente, representando mais de 90% dos e-mails em circulação.

Informações quânticas trafegam em rede de fibras ópticas

Redação do Site Inovação Tecnológica - 27/09/2010
Informações quânticas trafegam em rede de fibras ópticas

Cientistas do Instituto de Tecnologia da Geórgia, nos Estados Unidos, fizeram avanços em três elementos-chave necessários para os sistemas de informação quântica.
Entre as descobertas destaca-se uma técnica para converter fótons que transportam dados quânticos para comprimentos de onda que podem ser transmitidos por longas distâncias pelas redes de fibras ópticas.
Rede de informação quântica
Os avanços criam ferramentas importantes para a esperada construção de um protótipo de rede de informação quântica, que codifica os dados de forma segura por meio do entrelaçamento de átomos e fótons.
O objetivo de uma rede quântica é distribuir qubits entrelaçados - dois bits de dados relacionados que são ou "0" ou "1" - por longas distâncias. Os qubits viajavam como fótons pelas redes de fibras ópticas já existentes, que fazem parte do sistema de telecomunicações em nível mundial.
Devido às perdas na intensidade do sinal que ocorre ao longo das fibras ópticas, será necessário instalar repetidores (hubs) em intervalos regulares na rede para reforçar os sinais.
Para lidar com os qubits, esses repetidores vão precisar de uma memória quântica para receber o sinal fotônico, armazená-lo brevemente, e depois produzir um outro sinal de maior intensidade que vai transportar os dados para o nó seguinte, e assim por diante, até o seu destino final.
Conversão entre comprimentos de onda
Usando nuvens ultra-frias de átomos de rubídio, os pesquisadores desenvolveram um sistema eficiente para a conversão de fótons que carregam informações quânticas em comprimentos de onda infravermelhos para comprimentos de onda apropriado para a transmissão pelos sistemas de telecomunicações convencionais.
Os pesquisadores demonstraram que o sistema mantém as informações durante a conversão para os comprimentos de ondas das telecomunicações e de volta para os comprimentos de onda infravermelhos originais.
O segundo avanço foi no aumento da vida da informação quântica, que foi mantida por até 0,1 segundo. Isto é 30 vezes mais do que já havia sido conseguido antes e se aproxima da meta das memórias quânticas, que é de 1 segundo - o suficiente, acreditam os pesquisadores, para que a informação possa ser transmitida de forma confiável para o próximo nó da rede.
Por último, os pesquisadores desenvolveram a técnica necessária para converter de volta os fótons dos comprimentos de onda das telecomunicações para os comprimentos de onda infravermelhos, com baixo ruído e sem perder as informações codificadas quanticamente pelo entrelaçamento dos fótons.
A técnica de conversão óptica resolve um problema de longa data para a criação de redes quânticas: enquanto o comprimento de onda mais adequado para o armazenamento quântico é de 795 nanômetros, as fibras ópticas transmitem com menor absorção em 1300 nanômetros, ou 1,3 micrômetro.
Memória quântica
A conversão entre diferentes comprimentos de onda ocorre no interior de um sofisticado sistema que utiliza uma nuvem de átomos de rubídio densa o suficiente para maximizar a probabilidade de interação com os fótons que chegam.
Dois feixes separados de laser excitam os átomos de rubídio, que são mantidos em uma armadilha magneto-óptica cilíndrica de cerca de seis milímetros de comprimento.
O aparato gera um processo de mistura de quatro ondas que altera o comprimento de onda dos fótons que entram.
Assim que os fótons são convertidos em comprimentos de onda de telecomunicações, eles viajam através de uma fibra óptica e retornam para a armadilha magneto-óptica.
Eles são então convertidos de volta para comprimentos de onda infravermelhos para verificar se o emaranhamento quântico foi mantido.
A memória quântica é criada quando a luz de um laser é direcionada para a nuvem de átomos de rubídio. A energia excita os átomos, e os fótons produzidos pelos átomos no processo de excitação carregam informações sobre a própria excitação. São esses fótons, que carregam a informação quântica, que são introduzidos no sistema de conversão de comprimentos de onda.
"Este é o primeiro sistema em que uma memória quântica de longa duração foi integrada com a capacidade de transmitir em comprimentos de onda de telecomunicações", disse Brian Kennedy, um dos autores da pesquisa. "Nós temos agora os aspectos cruciais necessários para fazer um repetidor quântico".

Linux está pronto para processadores de até 48 núcleos

Geração multicore
Para continuar melhorando o desempenho dos computadores, os fabricantes se voltaram para a adição de mais "núcleos", ou unidades de processamento, em cada chip, deixando de lado a antiga corrida pela aceleração pura dos processadores.
Em princípio, um processador com dois núcleos será duas vezes mais rápido do que um processador com apenas um núcleo, um processador com quatro núcleos será quatro vezes mais rápido, e assim por diante.
Para isso, contudo, é necessário dividir as tarefas computacionais para que elas sejam executadas de forma eficiente em vários núcleos.
Fazer programas capazes disso é uma tarefa difícil, e essa dificuldade só aumenta conforme aumenta o número de núcleos.
Muitos especialistas defenderam que, para aproveitar a geração multicore seria necessário reinventar a computação, incluindo reescrever as linguagens de programação e os sistemas operacionais para permitir tirar proveito dos múltiplos núcleos em um único processador.
Linux multicore
Mas um grupo de pesquisadores do MIT, nos Estados Unidos, acaba de demonstrar que pode não ser necessário tal revolução, pelo menos a curto prazo.
Especificamente no caso do sistema operacional Linux, os pesquisadores demonstraram que a arquitetura de software atual poderá sobreviver muito bem a um aumento crescente de núcleos dentro de um mesmo processador - pelo menos até 48 núcleos por processador.
Para ter uma noção de como o Linux poderá rodar nos chips do futuro, os pesquisadores do MIT desenvolveram um sistema no qual oito processadores de seis núcleos simulam o funcionamento e o desempenho de um processador de 48 núcleos.
Usando esta plataforma, eles testaram uma bateria de aplicativos e testes de benchmarking que demandam fortemente o sistema operacional.
Em seguida, eles foram ativando os 48 núcleos, um por um, e observaram as consequências sobre o funcionamento do sistema operacional e sobre o seu desempenho.
Gargalo no contador
Num determinado ponto, a adição de mais núcleos começou a tornar o sistema operacional mais lento.
Mas, segundo os pesquisadores, o problema teve uma explicação surpreendentemente simples e pôde ser resolvido igualmente sem complicações.
Em um sistema multicore, os múltiplos núcleos muitas vezes executam cálculos que envolvem os mesmos dados. Enquanto os dados são necessários para algum núcleo, eles não podem ser apagados da memória. Assim, quando um núcleo começa a trabalhar com os dados, ele incrementa um contador central; quando ele termina a sua tarefa, ele decrementa o contador.
O contador, portanto, mantém uma contagem do número total de núcleos usando os dados. Quando a contagem chega a zero, o sistema operacional fica sabendo que pode apagar os dados, liberando memória para outros processos.
Conforme aumenta o número de núcleos, contudo, tarefas que dependem dos mesmos dados são divididas em pedaços cada vez menores. Os pesquisadores do MIT descobriram que, a partir daí, os núcleos começam a gastar tempo demais incrementando e decrementando o contador e acabam tendo menos tempo para realizar seu trabalho.
Depois de fazer uma alteração simples no código do Linux, para que cada núcleo mantivesse um contador local, que apenas ocasionalmente era sincronizado com o contador dos outros núcleos, o desempenho geral do sistema melhorou muito, e o acréscimo de núcleos voltou a melhorar o rendimento total do sistema.
Evolução em lugar de revolução
No futuro, se o número de núcleos em um processador for "significativamente maior do que 48", novas arquiteturas e sistemas operacionais poderão tornar-se necessários.
Para os próximos anos, argumentam os pesquisadores, o experimento mostra que um dos principais sistemas operacionais do mercado está pronto para continuar usufruindo dos progressos do hardware sem exigir uma revolução na área do software. A evolução será suficiente.
Contudo, apesar do problema com o contador de referência ter sido fácil de consertar, ele não foi nada fácil de identificar.
"Há um bocado de pesquisa interessante a ser feita na construção de ferramentas melhores para ajudar os programadores a identificar onde está o problema", afirmou Frans Kaashoek, um dos autores do estudo. "Nós escrevemos um monte de pequenas ferramentas para nos ajudar a descobrir o que estava acontecendo, mas nós gostaríamos de tornar o processo muito mais automatizado."

Retirado do site: http://www.inovacaotecnologica.com.br

Mundo virtual abriga criaturas autônomas com cognição e memória


Pesquisadores da Unicamp criaram um mundo virtual no qual as criaturas são autônomas, sem nenhum controle humano, devendo aprender como conviver com as demais.
O mundo virtual está sendo utilizado em pesquisas de neurociências, sobretudo sobre as chamadas memórias episódicas, aquelas que contêm nossa história de vida.
Mas as aplicações vão muito além, podendo servir para qualquer sistema computadorizado que precise ser capaz de lidar com uma quantidade muito grande de informações, da administração de empresas ao controle de trânsito.
Criaturas virtuais
Inicialmente, uma criatura é inserida no ambiente virtual e começa a explorar o novo mundo desconhecido.
Uma vez lá dentro, as criaturas são autônomas, ou seja, nenhum humano a controla. Elas devem agir de acordo com o que conseguiram aprender ao longo da convivência com outras criaturas virtuais semelhantes a ela.
Cada criatura deve executar tarefas predeterminadas, como coletar alimentos, encontrar e recolher objetos coloridos e competir com outras criaturas que também terão que fazer esses trabalhos e tentarão enganá-la, escondendo a comida e os objetos que possam-lhe interessar.
Para que seja bem-sucedida, a criatura virtual conta com recursos que tentam simular os sistemas cognitivos de animais e de seres humanos. Como em muitas situações comuns na vida real, será preciso recolher informações a respeito de um ambiente desconhecido (fazer uma codificação), guardá-las de um modo eficiente (armazenamento) e depois acessá-las quando forem necessárias (recuperação).

leia mais no site inovação tecnologica

Biocomputadores terão velocidade determinada pelo alimento disponível


Redação do Site Inovação Tecnológica - 11/01/2010

Pesquisadores da Universidade de Kent, no Reino Unido, divulgaram avanços importantes no campo da computação biológica.
Segundo eles, a computação feita por organismos vivos tem alguns limites fundamentais na velocidade de processamento - mas esses limites podem ser manipulados controlando-se a quantidade de alimentos disponíveis para esses computadores biológicos.
Computação biomolecular
O campo da computação molecular nasceu das tentativas de utilizar os componentes de organismos vivos - principalmente os genes - para rodar cálculos matemáticos no interior de células vivas.
Hoje, a eletrônica molecular também está avançando com moléculas inertes - orgânicas ou não - o avanço mais recente nesta área foi a criação do primeiro transístor molecular.
Isto causou uma divisão nesta área de pesquisas, fazendo com que os estudos com organismos vivos inaugurassem uma nova especialidade, chamada de computação biomolecular.
Atualmente, a maioria dos trabalhos em computação biomolecular é teórica, embora os primeiros avanços práticos já tenham sido apresentados, incluindo a criação de um compilador para biocomputadores e formas naturais de ler os resultados das computações.
Os usos futuros da tecnologia incluem computadores que poderão ser usados para liberar medicamentos no interior do corpo humano de forma autônoma, conforme encontrem determinadas condições ou tipos de células, como as células de um tumor.
Limites da computação biológica
Como computadores, biológicos ou não, estão sempre associados com velocidade de processamento, Dominique Chu e Radu Zabet resolveram explorar as possibilidades reais das "máquinas vivas" preconizadas pela biocomputação.
"Nossa pesquisa demonstra que a velocidade dos biocomputadores moleculares é fundamentalmente limitada pela sua taxa metabólica, ou seja, pela sua capacidade de processar energia. Uma de nossas principais conclusões é que um computador molecular deve equilibrar um trade-off entre a velocidade com que a computação é realizada e a precisão do resultado," explica o Dr. Chu.
"No entanto, um computador molecular pode aumentar tanto a velocidade quanto a confiabilidade de uma computação aumentando a energia que ele investe nos cálculos. Com relação aos computadores biomoleculares, quando falamos de energia, estamos falando de fontes de alimento," explica ele.
Estas conclusões representam limitações para o uso dos computadores biomoleculares no interior do corpo, por exemplo, onde a quantidade de alimento nem sempre pode ser controlada com precisão.
Por outro lado, os experimentos in vitro poderão acelerar as taxas das computações observadas nos ambientes naturais dos computadores biológicos, bastando para isso injetar mais energia no sistema - ou seja, mais alimento.
Computadores vivos
Os organismos vivos desempenham funções em vários níveis diferentes que podem ser exploradas para a execução de computações. Os exemplos vão desde o sistema nervoso complexo dos animais superiores, até as proteínas individuais.
Entender os limites de eficiência de cada um desses níveis é importante para que os cientistas possam centrar seus estudos em mecanismos mais promissores.
"Este é um dos primeiros trabalhos a analisar os limites fundamentais sobre os limites de velocidade dos biocomputadores moleculares", disse ele.
Design do mundo vivo
O Dr. Chu afirma que o estudo é importante também para a computação em geral e mesmo para o entendimento do funcionamento dos sistemas biológicos.
Segundo ele, além das implicações teóricas e práticas para o campo das máquinas moleculares, o estudo mostra o quanto ainda precisamos compreender sobre o próprio funcionamento dos seres vivos, que exploram as potencialidades de cálculo de uma forma que a ciência ainda não compreende totalmente.
Essa compreensão deve se aprofundar, se quisermos de fato reproduzir as capacidades de computação e de decisão observadas mesmo nas unidades mais básicas das moléculas e das células vivas.
"Nossos resultados são potencialmente de grande importância teórica e prática. Muito trabalho resta a ser feito para compreender suas implicações para o campo da computação molecular, mas também para a nossa compreensão dos princípios de design do mundo vivo," conclui ele.
Bibliografia:

Computational limits to binary genes
Nicolae Radu Zabet, Dominique F. Chu
Interface
December, 2009
Vol.: Published online before print
DOI: 10.1098/rsif.2009.0474

Animated Gifs

CHUCK NORRIS APROVA!
VAI DISCORDAR DELE?