Analisi Testuale con Python delle quotazioni dei titoli azionari alla pubblicazione di news

lente

Sono una studentessa di dottorato in Banca e Finanza e trai miei argomenti di ricerca mi interesso anche di reazione delle quotazioni dei titoli azionari alla pubblicazione di news. Ho raccolto, attraverso una banca dati privata, numerosissimi articoli di giornale pubblicati nel periodo 1998-2013.

E’ mia intenzione collegare le informazioni contenute negli articoli (content analysis) alle quotazioni dei titoli in borsa. La mole di dati da analizzare è tale per cui programmi quali Microsoft Word o Microsoft Excel non sono appropriati per assicurare rigore metodologico.

Mi sono, dunque, interessata al linguaggio di programmazione Python, a me completamente sconosciuto fino a poco fa (e non facilissimo da considerata la mia totale ignoranza circa i linguaggi di programmazione in generale). Vista la complessità dello script che mi interessava realizzare, mi sono messa in contatto con Marco Bruni per una serie di consulenze, che ad oggi mi hanno permesso di migliorare notevolmente il mio script di partenza ed approdare ad un codice in grado di assicurarmi la precisione e la rigorosità che si richiedono in ambito di ricerca.

In particolare Marco mi ha aiutato nei punti che elenco di seguito.

Leggi tutto “Analisi Testuale con Python delle quotazioni dei titoli azionari alla pubblicazione di news”

Amazon realizza un modulo software open source per la crittografica

Amazon realizza un modulo open source per la crittografica

La crittografia è la branca che tratta dei metodi per rendere un messaggio “offuscato” in modo da non essere comprensibile/intelligibile a persone non autorizzate a leggerlo. (cit. https://it.wikipedia.org/wiki/Crittografia)

La necessità di nascondere messaggi strategici da occhi nemici è antica quanto l’uomo: ci sono tracce di cifrari antichi quanto gli Ebrei; gli Spartani avevano un loro particolare sistema di comunicazione dei messaggi segreti; a Gaio Giulio Cesare si attribuisce l’uso del cosiddetto cifrario di Cesare, un sistema crittografico oggi ritenuto elementare, ma emblema della nascita di un concetto totalmente nuovo e ottimo per comprendere le idee basilari della crittografia.

Naturalmente anche nell’informatica da molti anni la crittografia viene utilizzata per evitare che qualche malintenzionato riesca a captare le nostre comunicazioni in chiaro. In particolar modo OpenSSL è un’implementazione open source dei protocolli Transport Layer Security (TLS) e il suo predecessore Secure Sockets Layer (SSL) che sono dei protocolli crittografici che permettono una comunicazione sicura dal sorgente al destinatario (end-to-end) su reti TCP/IP (come ad esempio Internet) fornendo autenticazione, integrità dei dati e cifratura operando al di sopra del livello di trasporto.

Amazon il noto portale di commercio elettronico ha anche una piattaforma di cloud computing e servizi web offerti commercialmente su web a partire dal 2002 chiamata Amazon Web Services che è nata come base sistemistica del portale di e-commerce e che sviluppa anche software open source a disposizione della comunità degli sviluppatori. Come ad esempio il modulo open source di Amazon s2n che potrebbe essere il sostituto più snello e sicuro di una parte del codice del noto standard OpenSSL.

L’obbiettivo di Amazon è quello di salvare il mondo da un altro disastro riguardo la sicurezza online come quello avvenuto lo scorso anno con Heartbleed, Amazon Web Services ha rilasciato questo modulo software a sorgente libero e aperto (open source) per proteggere i dati sensibili che passano attraverso Internet.

Gli ingegneri di AWS (Amazon Web Services) che hanno sviluppato s2n hanno ridotto al minimo il codice per implementare TLS (Transport Layer Security) con la speranza di rendere più facile individuare potenziali vulnerabilità di sicurezza, meno codice meno bugs, vecchio adagio del programmatore informatico 🙂

La libreria di Amazon s2n implementa TLS con 6.000 linee di codice, un numero significativamente inferiore rispetto alle attuali 70.000 linee di codice di TLS in OpenSSL, cioè lo sta

Docker, Google, Microsoft e Amazon stanno sviluppando insieme uno standard comune per i contenitori software

Docker

Fondata nel 2010 da Solomon Hykes Docker è un progetto open-source basato sul sistema operativo Linux, lanciato e gestito da dotCloud, che consente di automatizzare la distribuzione di qualsiasi applicazione all’interno dei “software containers” (contenitori software) che includono sistema operativo e applicazioni e sono una strada per sfruttare maggiormente le risorse di sistema inutilizzate.

Le macchine virtuali di Docker vengono chiamate container, e all’interno di un container possiamo inserire qualsiasi cosa: da un intero sistema operativo, ad un pool di applicazioni, fino al singolo servizio, la struttura dei container di Docker è estremamente granulare ed applicabile a qualsiasi livello. Inoltre, la comodità di Docker è che può essere usato in ambienti virtuali. Non importa assolutamente il mezzo, il programma funziona ovunque con la stessa metodologia e ugualmente bene.

Dopo anni di sviluppo finalmente anche i grandi dell’informatica hanno capito l’utilità di questo progetto open-source e insieme a Docker (che donerà il proprio software) si sono decisi a lanciare ieri alla conferenza DockerCon 2015 l’Open Container Project (Ocp), per offrire a singoli sviluppatori e aziende la sicurezza di poter realizzare soluzioni pienamente compatibili tra loro, senza frammentare troppo la scena e realizzando un vero standard. L’iniziativa ospitata all’interno della Linux Foundation, vede tra i principali protagonisti Amazon Web Services, Cisco, CoreOs, Google, Hp, Huawei, Ibm, Intel, Microsoft, Red Hat etc..

Tutto questo conferma per l’ennesima volta la bontà dello sviluppo software open-source (cioè mediante la condivisione della conoscenza) fondamentale nel realizzare uno standard comune vettore di progresso tecnologico per tutti, comprese le aziende informatiche.

Invece il modello closed-source cioè software proprietario non libero fatto di guerre di brevetti e marketing arricchisce solo pochissime persone come amministratori delegati e avvocati non apportando nessun progresso tecnologico alla società.

Voi cosa ne pensate?

Il mercoledì nero di Panda Antivirus e come risolvere errori strani in windows

Panda AntivirusOggi mercoledì 11 marzo 2015 è stato veramente un mercoledì nero per Panda Antivirus.

Appena tornato a lavoro dalla pausa pranzo, ho notato che il mio pc aveva malfunzionamenti e errori strani, il primo indizio è stato un errore di windows con un percorso che puntava all’ antivirus Panda.

Probabilmente il problema è nato da un aggiornamento automatico online fatto a pranzo da panda antivirus.

In alcuni clienti sembra che abbia creato problemi con gli aggiornamenti di windows rendendo l’attesa dell’aggiornamento infinita, in altri sembra che abbia cancellato file e programmi e in altri abbia bloccato il pc. Come risolvere?

SOLUZIONE

Per prima cosa provate ad aggiornare l’antivirus panda manualmente senza riavviare il pc per gli aggiornamenti di windows, perchè se no rischiate di fare danni seri. Se non sono scomparsi errori e malfunzionamenti strani dovete:

  • riavviare il pc in modalità provvisoria aspettare circa 5-10 minuti che vi arrivi il messaggio “E’ impossibile applicare gli aggiornamenti”
  • Entrate in windows in modalità provvisoria e bisogna disinstallare Panda Antivirus
  • riavviare il pc in modalità normale
  • aspettare 5-10 minuti che compaia il messaggio “E’ impossibile applicare gli aggiornamenti”
  • Entrare in windows e sicuramente saranno scomparsi gli errori strani, se siete stati fortunati non ci saranno ulteriori danni, altrimenti forse saranno spariti alcuni programmi che dovrete reinstallare

Chi è affezionato a panda antivirus oppure ha comprato una licenza basta aspettare qualche giorno che rilascino un ulteriore aggiornamento che sistemi tutto e poi si può tranquillamente reinstallare.

Naturalmente a casa mia non ho di questi problemi visto che uso Linux e quindi non ho bisogno di antivirus 🙂

Se volete dei chiarimenti scrivetemi un commento oppure  tramite la pagina dei contatti.

P.S.: qui trovate un articolo ufficiale di panda per la risoluzione del problema sperando che funzioni 🙂

E’ arrivato WordPress 4.1 “Dinah”: nuovo tema, scrittura senza distrazioni e scelta della lingua

wordpress-logoWordPress 4.1 che è una piattaforma software di “personal publishing” e content management system (CMS) con cui è gestito anche questo sito ti aiuta a mantenerti concentrato sulla scrittura ed il nuovo tema standard ti permetterà di visualizzare i tuoi contenuti con stile.

Il nostro nuovo tema predefinito, Twenty Fifteen, è un tema concentrato sui blog e disegnato per la massima chiarezza.
Twenty Fifteen ha un’impeccabile supporto alle lingue con l’aiuto della famiglia di font Noto di Google.

La semplice tipografia è leggibile su qualsiasi dimensione di schermo. I tuoi contenuti avranno sempre il centro del palco, sia che vengano visualizzati su un telefonino, un tablet, un laptop o su un computer fisso.

Leggi tutto “E’ arrivato WordPress 4.1 “Dinah”: nuovo tema, scrittura senza distrazioni e scelta della lingua”

WordPress 3.7 sta per arrivare, insieme agli aggiornamenti automatici

wordpress-logo

WordPress è una piattaforma software di “personal publishing” e content management system (CMS) che consente la creazione di un sito internet formato da contenuti testuali o multimediali, facilmente gestibili ed aggiornabili. (cit. wikipedia) che sta per arrivare alla versione 3.7, esattamente il suo percorso di sviluppo è arrivato alla versione Beta 2 cioè una versione non definitiva, da testare per scovare nuovi eventuali problemi o incompatibilità del software stesso, è ora disponibile per il download e test. Questo è un software ancora in sviluppo, quindi si sconsiglia di utilizzarlo in un sito in produzione.

Ecco le maggiori novità di questa versione di WordPress:

  • Aggiornamenti automatici in background, mentre dormite 🙂, con WordPress 3.7, adesso non c’è bisogno di alzare un dito per applicare la manutenzione e gli aggiornamenti di sicurezza. La maggior parte dei siti sono ora in grado di applicare automaticamente gli aggiornamenti in background. Il processo di aggiornamento inoltre è stato reso ancora più affidabile e sicuro, con decine di nuovi controlli e tutele.
  • Controllo per usare password forti: La tua password è la prima difesa dagli attacchi, quindi bisogna usare password complesse di almeno 10 caratteri con maiuscole, minuscole, numeri e adesso WordPress vi dirà se sono abbastanza forti
  • Miglior supporto internazionale: le versioni localizzate nella varie lingue compresa l’italiano saranno supportate in maniera completa, con aggiornamenti completi e celeri

E ‘davvero facile testarlo, perchè una volta installato WordPress Beta2 verrà aggiornato ogni giorno con l’ultima versione di sviluppo e il risultato arriverà in posta elettronica. Per ottenere la versione beta, provate il plugin WordPress Beta Tester oppure è possibile scaricare la versione beta di WordPress qui (zip). In Pannello → Aggiornamenti potete controllare se la vostra installazione è compatibile con gli aggiornamenti automatici in background perchè ad esempio non è possibile utilizzare questa opzione in un software per il controllo di versione, come SVN o Git.

E’ stata aumentata la stabilità della aggiornamenti in background e corretti circa 50 bug, tra cui una correzione per Internet Explorer 11 in editor visuale.

Se pensi di aver trovato un bug, è possibile inviare la segnalazione alla zona Alpha/Beta nei forum di supporto. Oppure, se sei a tuo agio a scrivere un bug report, puoi inviare un file al WordPress Trac. Nel WordPress Trac puoi anche trovare una lista dei bug noti e di quelli che sono stati risolti.

Ora che avete tutte le informazioni e tutti gli strumenti per “smanettare” sul futuro WordPress 3.7 potete dare sfogo alla vostra fantasia :-), però mi raccomando da fare NON in ambienti in produzione. Buon divertimento 🙂

UPDATE: Uscito l’aggiornamento alla versione 3.7.1, pensavo che non funzionassero gli aggiornamenti automatici perchè speravo avvenissero in tempo reale 🙁 , invece pare ci vogliano 3/4 giorni. Vedremo nel prossimo aggiornamento..Stay Tunes 🙂

Via: WordPress.org

Google App Engine PHP Runtime ora disponibile per tutti

Google App Engine PHP Runtime

Google App Engine PHP Runtime oggi , dopo un periodo di prova limitato, è stato reso disponibile per tutti. Al Google I/O, all’inizio di quest’anno, hanno aggiunto PHP, il quarto linguaggio di programmazione per realizzare applicazioni in Google App Engine.

Non è più necessario per fortuna far parte della whitelist per sviluppare la nostra applicazione PHP su Google App Engine. PHP è oggi uno dei linguaggi di programmazione per il web più popolari al mondo. Dal momento che è stato lanciato al Google I/O all’inizio di quest’anno, migliaia di sviluppatori in tutto il mondo hanno iniziato a utilizzare App Engine per PHP, per eseguire software famosi fatti in PHP come phpMyAdmin , Drupal e phpBB e framework quali Laravel , Silex e CodeIgniter utilizzando anche le API di Google come Drive e Google+ su App Engine.

Uno dei primi utilizzatori di Google App Engine per PHP è stato VICE.com, con cui ci gestisce il blog principale. Riceve milioni di visitatori al mese, e gira su un CMS fatto in casa realizzato grazie al popolare framework PHP Yii. Dopo aver spostato completamente il tutto in Google App Engine sembra che siano davvero entusiasti, “E ‘nostro parere che Google sta costruendo la Platform as a service(PaaS) di nuova generazione”, ha dichiarato il CTO di VICE.com, Jesse Knight. Fin dall’introduzione del runtime PHP, Google ha fatto alcuni miglioramenti, tra cui:

Se si lavora nel cloud, è possibile creare, testare e distribuire il progetto dal browser utilizzando DevTable o CodeEnvy che sono degli IDE on the cloud 🙂 . Se si preferisce lavorare dal proprio desktop, ora è possibile lavorare a livello locale ed eseguire il debug e distribuire Google App Engine grazie all’ IDE JetBrain PhpStorm. Infine per concludere gli sviluppatori interessati a PHP ora possono creare un account in Google App Engine PHP Runtime e distribuire immediatamente le applicazioni PHP e volendo possono condividere le loro avventure con la comunità di Google+.

Voi l’avete provato?

Via googlecloudplatform.blogspot.it

Microsoft sta cercando di risolvere i problemi col nuovo supporto IMAP in Outlook.com

outlook.com

Microsoft ha finalmente aggiunto il supporto, a lungo promesso, per il protocollo IMAP nel suo servizio di posta elettronica Outlook.com all’inizio di questa settimana, ma la nuova funzione a quanto pare è ancora un po ‘buggy per alcuni utenti, che hanno pubblicato i loro problemi nei commenti sul blog ufficiale di Office.

La maggior parte dei reclami degli utenti dicono che non possono connettersi a Outlook.com con i loro programmi di posta elettronica basato su IMAP , come Mail Mac e le versioni per Mac e Linux di Thunderbird. Un esempio di questo problema è stato segnalato il sabato da Stan Wintraecken, che ha scritto, “Mail Mac sta solo sincronizzando i miei messaggi cancellati con outlook.com e non la mia casella di posta, ma invia un errore:.. Errore 9. Errore del server. Si prega di riprovare più tardi. “.

Nello stesso thread, il Program Manager di Outlook.com Ben Poon ha detto che Microsoft ha “visto una manciata di segnalazioni di utenti che hanno l’errore 9 quindi stiamo vagliano e studiando questo problema con la massima priorità.” Altre persone hanno anche scritto che le email cancellate nel loro client IMAP rimangono sul sito Outlook.com.

Source: Microsoft | Image via Microsoft

WordPress: aggiornamento alla versione 3.4 “Green”, messaggi strani e scomparsa dei bottoni tag nella scrittura dei post

wordpress

WordPress 3.4 è oramai uscito da parecchi giorni.

Questa versione include miglioramenti significativi alla personalizzazione dei temi, intestazioni personalizzate, e dei messaggi incorporati di Twitter, e le didascalie delle immagini – qui c’è un breve filmato con gli highlights:

Se dovesse capitare anche a voi dopo aver aggiornato alla versione WordPress 3.4 dal pannello il messaggio “Il database è già aggiornato continua” non vi preoccupate, dovete semplicemente ripulire la cache del votro browser per tornare alla normalità e ritornare al pannello.

Infine se sono scomparsi i bottoni tag tipo link, ul, ol etc.. e siete impossibilitati nel cambiare le impostazioni dello schermo, basta aggiornare sempre dal pannello all’ultima versione uscita in questi giorni cioè la versione di WordPress 3.4.1 e tutto tornerà alla normalità 😉

PostgreSQL 9.2 Beta 1 disponibile per i test

LogoIl Gruppo di Sviluppo di PostgreSQL (che è forse il più potente e completo database relazionale ad oggetti rilasciato con licenza libera) ha annunciato la beta della nuova versione 9.2, che includerà importanti aumenti di prestazioni e scalabilità sia verticale che orizzontale.

Gli sviluppatori di questo progetto chiedono a tutti gli utenti e alla comunità di scaricare e iniziare a misurare questa nuova versione il più presto possibile.

Ecco i progressi relativi alla versione beta 9.2:

  • Index-only scans, consente agli utenti di evitare inefficienti scansioni di tabelle di base
  • Lettura di record che riesce a scalare fino a 64 core e con oltre 300.000 query al secondo
  • Miglioramenti nella velocità di scrittura di gruppo, tra cui i commit
  • Riduzione del consumo di risorse della CPU
  • Repliche a cascata, supporto di rete di database distribuiti geograficamente in standby

Questa versione offrirà anche molte nuove funzionalità per gli sviluppatori di applicazioni, tra cui:

    • supporto di dati JSON, permettendo ibridi nei record dei database relazionali tra dati normali e dati JSON
    • Tipi di intervallo, supporto di nuovi tipi di calendario, serie temporali e applicazioni analitiche
    • Diversi miglioramenti al comando ALTER e altre dichiarazioni, facilitando gli aggiornamenti del database runtime

Per un elenco completo delle caratteristiche di questa versione 9.2 beta, vedere le note di rilascio.

Accolgo e rigiro l’appello di questa splendida comunità:

Dipendiamo dalla nostra comunità per testare la nuova versione in modo da garantire una versione ad alte prestazioni e bug-free. Si prega di scaricarlo e provarlo con grandi carichi di lavoro e con le applicazioni il più presto possibile, e dare un feedback agli sviluppatori di questo database. Ulteriori informazioni su come verificare e segnalare problemi

Puoi prendere PostgreSQL 9.2 beta, inclusi i binari e i pacchetti di installazione per Windows, Mac e Linux dalla pagina di download.

La documentazione completa della nuova versione è disponibile online, e installata anche con PostgreSQL.

Buon Divertimento 🙂

Frammenti di WordPress: Reindirizzare il feed RSS verso il nostro Feedburner

Feedburner è un servizio ben noto che consente di sapere quante persone hanno sottoscritto il tuo feed RSS. Con questo codice facciamo in modo che il nostro feed Rss di default di wordpress come ad esempio per questo blog http://www.marcobruni.info/wordpress/rss/ venga reindirizzato automaticamente al mio Feedburner http://feeds.feedburner.com/marcobruni.

Basta incollare queste 4 righe di codice all’interno del file functions.php (Funzioni Tema) tramite il menù di wordpress Aspetto->Editor, salvate il file e il gioco è fatto!

// Redirect RSS feeds to Feedburner
add_action('template_redirect', 'cwc_rss_redirect');

function cwc_rss_redirect() {
	if ( is_feed() && !preg_match('/feedburner|feedvalidator/i', $_SERVER['HTTP_USER_AGENT'])){
		header('Location: http://feeds.feedburner.com/marcobruni');
		header('HTTP/1.1 302 Temporary Redirect');
	}
}

Aggiornamento di WordPress 3.3.1 in inglese

Da qualche ora appare sulla vostra bacheca di WordPress l’aggiornamento alla versione 3.3.1. E’ una versione di manutenzione che corregge 15 problemi di WordPress 3.3 ma sopratutto corregge una vulnerabilità di sicurezza relativa al cross-site scripting (XSS) riguardante la versione 3.3. E’ stato il team di sicurezza dell’hosting Go Daddy ha segnalare il problema al security team di WordPress.

Come ogni release di sicurezza la sua installazione è fortemente consigliata anche negli ambienti di produzione italiani, non essendovi modifiche alle stringhe di traduzione WordPress rimarrà completamente in italiano.

E’ consigliabile come SEMPRE effettuare un backup completo sia del proprio spazio web che del database prima di procedere a qualsiasi aggiornamento.

Pubblicato il nuovo rilascio del database open source PostgreSQL 9.1

E’ uscita la nuova versione del database open source PostgreSQL .

In questa versione ci sono importanti e interessanti funzionalità come la synchronous replication che adesso è asincrono per default, eviterà perdite di dati. Nello specifico se il server primario si bloccava poi alcune operazioni che sono state confermate ancora non sono state replicate al server di standby, può causare la perdita di dati. La quantità di perdita di dati è proporzionale al ritardo di replica al momento del failover. Questo livello di protezione è indicato come 2-safe replication nella teoria informatica.

Serializable snapshot isolation fornisce l’isolamento stretto delle transazioni, questo livello emula l’esecuzione seriale delle transazioni, come se le operazioni fossero state eseguite una dopo l’altra, in serie, piuttosto che in concomitanza.

Support of per-column collations permette di specificare il tipo di ordinamento e classificazione del comportamento carattere di dati per colonna, o anche di funzionamento. Questo allevia la restrizione che le impostazioni LC_COLLATE e LC_CTYPE di un database impediscono la modifica dopo la sua creazione.

Foreign data wrappers e supporto e controllo dei permessi SELinux e molte altre cose. La lista completa di cambiamenti la trovi qui.

I numeri impressionanti di WordPress [Infografica]

Oramai wordpress è la piattaforma di editoria personale più usata al mondo, ad esempio è la piattaforma CMS più usata nelle attuali primarie in USA.

Io la utilizzo da anni per tutti i miei blog compreso questo e per tutti i clienti per cui ho lavorato, ed è secondo me uno strumento eccezionale, molto potente, versatile e modificabile.

E’ un software Open Source quindi a disposizione di tutti anche per eventuali modifiche, semplice da utilizzare e con temi grafici già pronti. Questa è la bellezza dell’open source poter modificare il codice per fargli fare quello che vogliamo noi e non abituarci noi al software. Io ho messo le mani sul codice di wordpress di tutti i miei blog perché volevo sperimentare tutte le sue potenzialità.

Per tutte queste ragioni hackertarget.com ha condotto un analisi dettagliata sull’uso di wordpress nel mondo che ha prodotto questa interessante infografica:

Infografica sull'uso di WordPress nel mondo
Infografica sull'uso di WordPress nel mondo