Infos Inist

[Portrait Inist] Kai SONG

Nous avons accueilli à l’Inist le 1er février 2022 (jusqu’au 15/12/22),  Kai SONG au sein du service «Text & Data Mining» sous la responsabilité de Pascal CUXAC. Kai SONG dans le cadre d’une convention, sera présente afin d’effectuer des travaux de recherche pour le projet intitulé «Analyse incrémentale de corpus». Kai s’est prêtée au jeu de l’interview, découvrez son portrait.

Cécilia : Hello Kai, I would like to do a presentation portrait for the unit’s internal communication blog

Kai :  I am very happy to have this communication with you.

(fr): Cécilia : Bonjour Kai, je voudrais faire un portrait de présentation pour le blog de communication interne de l’unité.

(fr): Kai : Je suis très heureuse d’avoir cet échange avec vous. 

Kai, you joined Inist on February 1st, what is your position, your service and your department?

(en): My work will take place in the « Text Data Mining » service within the « Information Analysis and Mining » department of INIST.

(fr): Kai, vous avez rejoint l’Inist le 1er février, quel est votre poste, votre service et votre département ?

(fr):  Je vais travailler dans le service de Pascal CUXAC : « Text & Data Mining » au sein du département « Analyse et fouille de l’information » de l’Inist.

Can you explain your mission to all the staff in the unit?

  • Detecting topics in a corpus and building topic models on the fly (in an incremental way), without storing documents in memory and without using large computing resources. The topic models can be updated when the corpus is updated one by one.
  • Detecting weak signals or emerging themes in a corpus and associating them with documents.
  • Adjusting the above models to embed them in web services.

Pouvez-vous expliquer votre mission à l’ensemble du personnel de l’unité ?

  • Détecter des sujets dans un corpus et construire des modèles de thématiques à la volée (de manière incrémentale), sans stocker les documents en mémoire et sans utiliser d’importantes ressources informatiques. Ces modèles peuvent être mis à jour lorsque le corpus est mis à jour un par un.
  • Détecter les signaux faibles ou les thèmes émergents dans un corpus et les associer aux documents.
  • Ajuster les modèles ci-dessus pour les intégrer dans des services web.

Kai, what is your educational background?

After graduating with a Bachelor of Engineering in 2015, I went on to get a Master of Engineering from Anhui University. During the period of master degree study, I do research on computer vision based on deep learning. When I entered Dalian University of Technology (DUT) for my Ph.D., I was engaged in text mining. The transition from image to text is very interesting.

Kai, quel est votre parcours d’études ?

Après avoir obtenu un Bachelor en ingénierie en 2015, j’ai poursuivi mes études par un Master en ingénierie de l’Université d’Anhui. Pendant mon Master, j’ai fait des recherches sur la vision par ordinateur basée sur l’apprentissage profond. Lorsque je suis entrée à l’Université de technologie de Dalian (DUT) pour mon doctorat, je me suis dirigée vers la fouille de textes. Passer du traitement de l’image au texte est très intéressant.

What is your previous professional experience?

I don’t have any work experience before.

Quelle est votre expérience professionnelle antérieure ?

Je n’ai pas eu d’expérience professionnelle avant cela.

Kai, what was your motivation for applying for this fixed-term contract?

I am a third-year Ph.D. student and mainly work on textual data processing for applications in scientometrics. The research topic of my thesis is implementing different types of machine learning algorithms on papers or patents. More specifically incremental classification and clustering algorithms adapted to the diachronic analysis of texts. This type of analysis is central and extremely strategic for the processing of scientific and technical data. Joining the INIST is a good chance for me to put the algorithms into practice, I would be very happy if the program I code could be applied to web services. Meanwhile, I believe that I can acquire new skills and knowledge in INIST.

Kai, quelle a été votre motivation pour postuler à ce contrat à durée déterminée ?

Je suis étudiante en troisième année de doctorat et je travaille principalement sur le traitement des données textuelles pour des applications en scientométrie. Le sujet de recherche de ma thèse est l’implémentation de différents types d’algorithmes d’apprentissage automatique sur des articles ou des brevets. Plus précisément des algorithmes de classification incrémentale et de clustering adaptés à l’analyse diachronique de textes. Ce type d’analyse est central et extrêmement stratégique pour le traitement des données scientifiques et techniques. Rejoindre l’Inist est une bonne occasion pour moi de mettre en pratique ces algorithmes, je serais très heureuse si le programme que je code pouvait être appliqué aux services web. Durant cette période, je crois que je vais pouvoir acquérir de nouvelles compétences et connaissances à l’Inist.

And finally your Chinese portrait:

  • If I were a language… I would be Python
  • If I were an object… I would be the black hole
  • If I were a shared tool… I would be Stack Overflow
  • If I were a sound… I would be pop music
  • If I were a means of transport… I would be the 11 bus
  • If I were a cake… I would be Tiramisu
  • If I were a character… I would be iron Man
  • If I were a musical instrument… I would be cello
  • If I were a means of communication… I would be WeChat
  • If I were a source of energy… I would be the sun

 

  • Si j’étais une langue… Je serais Python
  • Si j’étais un objet… Je serais le trou noir
  • Si j’étais un outil partagé… Je serais Stack Overflow
  • Si j’étais un son… Je serais la musique pop
  • Si j’étais un moyen de transport… Je serais le bus 11
  • Si j’étais un gâteau… Je serais le Tiramisu
  • Si j’étais un personnage… Je serais Iron Man
  • Si j’étais un instrument de musique… Je serais le violoncelle
  • Si j’étais un moyen de communication… Je serais WeChat
  • Si j’étais une source d’énergie… Je serais le soleil

 

Merci Jean-François Nominé pour la relecture attentive de la version française de l’interview