Pages

Saturday, January 12, 2008

Integrando melhor o del.icio.us com o Pipes

Pessoal, essa foi minha primeira grande besteira escrita nesse blog. No entusiasmo de resolver o problema não percebi que a variável que eu manipulava não era a que eu imaginava estar manipulando. Resultado, o segundo problema listado abaixo está sem solução até o momento. Estou editando esse tópico para deixar apenas o que funciona.

Depois ter dado uma idéia de como usar o Pipes para acompanhar conteúdo marcado com certas tags no del.icio.us. Eu fiquei pensando se não existiria uma forma de contornar alguns problemas que ainda persistiam.

O primeiro desses problemas são os links de páginas escritas em línguas completamente incompreensíveis para mim, ou seja, diferentes de português, inglês, espanhol, francês e italiano. E não. Eu não falo/leio em todas essas línguas. Eu digo que elas são compreensíveis para mim porque quando eu as vejo escritas, eu sei que língua é. Ao contrário do que acontece quando vejo um texto escrito em alemão, holandês, russo, japonês, chinês e toda e qualquer língua que não utilize apenas o alfabeto latino para escrever. E se eu não sei que língua é, eu nem consigo tentar a sorte no tradutor online.

O segundo problema são os links populares. Eu resolvi boa parte do problema de duplicidade de links, mas não resolvi, por exemplo, quando pela enésima vez alguém adiciona a página principal do ubuntu ou do firefox. É justo, lógico e honorável que essas adições ocorram, mas eu já conheço esses links a "décadas", não é muito produtivo ter que filtrar esses links em meio a uma lista mais uma vez (observe que a lista de links populares é muito, mas muito grande, não é apenas dois ou três links, estamos falando de centenas, alguns são repetidos aos milhares).

Então, como resolver essas questões ?

Eu resolvi a primeira de forma parcial. Eu adicionei um filtro de conteúdo para eliminar pelo título quando houver certos caracteres nele. Como eu não conheço nada de língua oriental, o que fiz foi a abrir a página e copiar alguns desses caracteres para o módulo. Minha idéia é alimentar um filtro por aprendizado, ou seja, agora eu elimino um símbolo, mas haverão outros, então eu alimento mais um, e assim vou até que não veja mais links com símbolos que eu nem sei o que são. Eu precisei de uns 9 símbolos, pegos completamente ao acaso (e cuja origem ou significado eu desconheço) para eliminar mais de 80 % do volume de material que eu não sou capaz de compreender.

A solução não é completa porque ainda existe o alemão, o holandês, o norueguês, etc... (a lista de línguas nórdicas não tão pequena). Não dá para filtrar tudo, mas resolveu muita coisa.

[edição grande]
A segunda questão não foi , impressionantemente, resolvida. A questão toda estava bem debaixo do meu nariz. Existe um item chamado "y:repeatcount" que tem como valor justamente o número de vezes que alguém adicionou aquela página no sistema do del.icio.us. Então o que fiz por criar um módulo de filtro (Operators > Filter), que permitirá apenas (Permit) links que combinem com qualquer uma das regras (any) definidas de tal forma que item.y:repeatcount seja igual a 1 ou a 2 ou a 3 ou 4 ou a 5 ou 6 ou a 7. Sim. Eu vou me permitir ver o mesmo link 7 vezes. Isso pode parecer improdutivo, e até é, mas não tanto quanto parece. Ocorre quem em meio a uma lista é fácil perder a oportunidade de conhecer um novo bom link, quando eu permito que seja repetido, eu me dou chance de ver o link mais de uma vez e diminuo a chance de perder bons links. E está muito longe de ser tão improdutivo quanto ver o mesmo link milhares de vezes. A idéia é boa, mas o y:repeatcount não é o que eu imaginei que fosse, então o que eu digo que vai acontecer, simplesmente não acontece. Eu fui iludido com o fato de apenas uma fração do resultados serem mostrados no debug do pipe e de não ter feito um análise mais cuidadosa quando os resultados chegaram no leitor de feeds.

Eu removi a figura, pois ela não tem mais o impacto que tinha antes.

Com isso, temos um pipe que fornece quase a mesma a mesma coisa de antes. Ainda verei se consigo resolver o problema dos links muito populares, mas certamente com o fim das minhas férias não devo ter o mesmo tempo para me dedicar a esse assunto.

Porque não dizer : Eu aproveitei a oportunidade e adicionei um "sort" um elemento que me permite organizar a lista de links com uma certa ordem. E eu escolhi a ordem descendente na data de publicação. Mas isso é só cosmético.
[/edição grande]

Lamento qualquer inconveniente.

OBS.: só agora percebi, essa é uma integração completamente "Yahoo!".

No comments:

Post a Comment