Pergunta

Esta questão tem menos a ver com código real e mais a ver com os métodos subjacentes.

Meu 'chefe' na minha pseudo -interno solicitou que eu escreva um script que raspará uma lista de links do tweet de um usuário (a lista acontece uma vez por semana, e é sempre o mesmo usuário) e depois publique a referida lista para a conta Tumblr da empresa.

Atualmente, estou pensando nessa estrutura: a base será um script bash que primeiro chama algum script que usa a API do Twitter para encontrar o post, dada uma hashtag e analisar a lista (candidatos atuais para idiomas sendo Perl, Php e Ruby, em nenhuma ordem específica). Em seguida, o script armazenará a lista analisada (com alguma marcação) em um arquivo de texto, de onde outro script que usa a API do Tumblr formatará a lista e a publicará.

Esta é uma maneira sensata de fazer isso? Até agora, planejando, estou apenas de acordo com a postagem do Twitter, mas já estou preso entre usar a API para pegar a postagem ou apenas pegar o feed que eles fornecem e tentando analisá -lo. Eu sei que não é realmente um grande projeto, mas é certamente o maior que já iniciei, por isso estou paralisado com medo quando se trata de tomar decisões!

Foi útil?

Solução

Na sua descrição, não há razão para que você não consiga fazer tudo em um script, o que simplificaria as coisas, a menos que haja um bom motivo para transportar os dados entre dois scripts. E antes de abrir as conexões manualmente, existem bibliotecas escritas para muitos idiomas para o Tumblr e o Twitter que podem facilitar seu trabalho. Você definitivamente não deve tentar analisar o feed RSS - eles fornecem uma API por um motivo.*

Eu pessoalmente iria com Python, pois é rápido em funcionar e correr e possui ótimas bibliotecas para essas coisas. Mas se você não estiver familiarizado com isso, existem bibliotecas disponíveis para Ruby ou Perl também (PHP menos). Basta pesquisar no Google "{plataform} biblioteca {idioma}" - uma pesquisa rápida me deu python-tumblr, Www: tumblr, e rubi-tumblr, assim como Python-Twitter, Net :: Twitter, e uma jóia rubi "Twitter".

Qualquer uma dessas bibliotecas deve facilitar a conexão ao Twitter para puxar os tweets para um usuário ou hashtag específico por meio da API. Você pode passar por eles, analisando -o conforme necessário e, em seguida, usar a biblioteca do Tumblr para publicá -los no Tumblr em qualquer formato que desejar.

Você posso Faça isso manualmente - abrindo e lendo conexões ou, pior ainda, raspando a tela, mas não há realmente sentido em fazer isso se você tem uma boa biblioteca disponível - o que você faz - e é mais propenso a problemas, peculiaridades e bugs que passam despercebidos . E, como eu disse, a menos que haja um bom motivo para usar o script intermediário Bash, seria muito mais fácil manter os dados em um script, em uma matriz ou em alguma outra estrutura de dados. Se você precisar em um arquivo também, basta escrevê -lo quando terminar, no mesmo script.

*A única complicação possível aqui é E se Você precisa autenticar para o Twitter - o que eu acho que não, se você está apenas recebendo uma linha do tempo do usuário - eles estarão descontinuando a autenticação básica em breve, então você terá que configurar uma conta OAuth (veja "O que é oauth" em dev.twitter.com). Isso não é realmente um problema, mas torna as coisas um pouco mais complicadas. A API ainda deve ser mais fácil do que analisar o feed RSS.

Outras dicas

Sua abordagem parece ser apropriada.

  • Utilize a API User_timeline Twitter para buscar todos os tweets postados por um usuário.
  • Pare a lista Fetcned (pode estar usando o Regex) para extrair links dos tweets e armazená -los em um arquivo externo.
  • Publique esses links para a conta do Tumblr usando a API de gravação do Tumblr.

Você também pode querer rastrear o último ID do Tweet no Twitter para que você possa continuar a extração desse ID do tweet.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top