@Michel non, ce n'est pas la même chose. Je suis à SuperDemain toute seule pour parler gouvernance de la data en général ce dimanche et on fera un talk à 2 avec @Dorialexander lors des @Rmll2017 début juillet.
Ah mais c'est qu'elle est drôlement bien d'ici : je découvre pleins de #belleschoses, des autobio d'universitaires, des débats de geeks, et il y a même un peu de porn
French state seems to be opening its own instance on Mastodon. https://amicale.net/users/DINSIC/updates/148
Le roi n'avait pas d'enfants. Il vieillissait et les intrigues s'ourdissaient.
Il se résigna à appeler la sorcière.
— J'ai vu dans les étoiles que vous avez un alter ego. Son enfant pourra vous succéder. Mais il habite loin : sur la Lune.
Le plus grand chevalier du royaume attela la plus grande colombe du royaume. Au terme d'un tumultueux voyage céleste, il revint avec la fille de l'alter ego sélène.
Le roi était mort entre temps. Ce fut le début d'une longue guerre civile. #mercredifiction
Tout était prêt pour son grand départ dans un univers parallèle.
— Cet univers a légèrement divergé avec le nôtre. Les choses seront juste un peu différentes.
— Bon voyage !
Il claqua la porte. L'engin disparut. Dix minutes après il était de retour.
— Déjà rentré ?
— Arrivé plutôt. Cet univers ressemble beaucoup à l'autre.
— Ce n'était pas une panne ?
Ils eurent toujours un doute.
#mercredifiction
Au total, 17,5% des éditions sont également numérisées sur Gallica (ce qui est assez énorme), mais il y a des variations significatives selon les années (de 3% en 1530 à… 31% en 1731). Globalement, le XVIIIe siècle est la période la mieux représentée
[Nouveau billet] Les bibliothèques numériques sont-elles représentatives ?https://scoms.hypotheses.org/799 À partir de l'ensemble des métadonnées de data BNF avant 1900 j'ai tenté d'évaluer la "représentativité" de Gallica au fil du temps à partir de la proportion d'éditions mentionnées dans le Catalogue de la BNF qui ont également été numérisées. https://mastodon.social/media/Dsl3QJ2M6DsdgFZE8kA
Tiens existe maintenant une "table périodique" de la data science. https://i2.wp.com/s3.amazonaws.com/assets.datacamp.com/blog_assets/Data-Science-Periodic-Table.png?ssl=1 Honnêtement elle n'est pas très réussie : trop de trucs totalement subsidiaires ou peu actifs (par exemple Academic Torrent n'a jamais vraiment décollé) et inversement des oublis étonnant (Sparql ? Wikipédia ? Wikidata ?). Je suis à deux doigts de proposer mon fork…
J'en profite pour relayer cette petite présentation sur #word2vec et humanités numériques que j'avais fait pour un séminaire du GFII https://www.gfii.fr/uploads/docs/PierreCarl-Langlais_Deep%20Learning%20&%20Text%20Mining(2).pdf (oui il faudrait que je trouve le temps de la déposer sur slideshare)
Comme quoi le fil fédéré a du bon : j'y traîne au petit bonheur et je découvre par hasard le seul mastonaute à causer de #word2vec :) https://mastodon.cloud/users/RefurioAnachro/updates/153277
Franchement si avec ça les littéraires ne débarquent pas sur mastodon… RT @Alexis_Ids
En réaction, quelqu'un a donc très logiquement créé une instance dolphinienne, où seule la lettre "e" est autorisée.
#oulipo #crazy #dolphin #dauphin #whynot https://mamot.fr/system/media_attachments/files/000/018/931/original/b6869f8f46d66e24.png?1492164109
J'en ai aussi profité pour refaire mon réseau de relations entre instances sur une semaine entière (sans Mastodon.social et Mastodon.xyz qui bouchent la vue). Ça vaudrait sans doute le coup d'en tirer une version dynamique… https://mastodon.social/media/QS6fz_iVbcnes9_7gNE
Dans la foulée le graphe de croissance des 6 principales instances de #Mastodon (échelle logarithmique) avec des différences assez marquées - décollages soudains vs. essor plus progressif #rstats
https://mastodon.social/media/DCZ5UldwhfiCF1_E7VY
La prochaine étape serait de détecter les langues (pour voir l'essor des toots en anglais, français, allemande et, depuis peu, japonais). Cela devrait être jouable avec NLTK…
Et voici maintenant le graphe de l'ascension de #Mastodon : nombre moyen de toots sur la timeline publique du 28 mars (21h00) au 8 avril (21h00). Avec une première phase de croissance le 31, ça s'emballe complètement le 3 puis le 4, rythme de croisière ensuite… #rstats
https://mastodon.social/media/L08bAaoF4a7vIFiiaGE
@dorialexander Tout à fait! Avec un étudiant on a bossé sur la manière dont les décideurs utilisent le sentiment analysis basique (positif/négatif/neutre) : certains veulent y voir le reflet de leurs stratégies et donc préfèrent des possibilités d'interprétations plus larges... Pourtant oui, on peut faire du lourd en SA :)
Tiens alors même que j'inaugure ma connexion #rstats un tout nouveau site dédié vient de sortir sur ggplot2 http://ggplot2.tidyverse.org/ Rien de très neuf sur le fond mais bien présenté.
Et je teste un premier post envoyé directement depuis #Rstat grâce à la super extension de @thchln@framapiaf.org - disponible par ici : https://github.com/ThomasChln/mastodon
@Dorialexander ce doux moment où l'on attend l’exécution d'une tâche et que l'on peut micro-glander !
Mastonaut in quantum state…