Tests de plusieurs SoundFont®

Auteur Message
Le format SFZ n’est pas un format SF2 compressé comme son nom peut le faire croire, c’est un format texte Rougi , je viens de l’apprendre. Les échantillons sonores accompagne des fichiers texte à côté, le fichier texte indiquant les chemin vers les échantillons, typiquement au format WAV.

Il semble que le format SFZ devient plus répandu que le format SF2, ce qui est étonnant, comme ce format n’est même pas clairement documenté et que sa spécification d’origine est disparue. Il existe une tentative de le standardiser à postériori : sfzformat.com.

Il y a plus qu’une différence de format entre SFZ et SF2, il y a des différences de fonctionnalités.

En parlant d’échantillons, en exportant la SoundFont Titanic vers le format SFZ, j’ai put constater que le bruit parasite dont je parlais dans le précédent message, vient de l’échantillon. Même si Titanic me semble meilleure que les autres, cette police sonore est loin d’être correctement conçue, parce que l’échantillon utilisé pour cet intervalle n’est vraiment pas en accord avec les autres.
J’ai refait une évaluation en reprenant les mêmes SoundFont que pour le premier test. Le résultat confirme l’intérêt des banques de sons Titanic et Evanessence‑2, déjà confirmé par le second test et reconfirmé donc par ce troisième test. Mais ce troisième teste met en avant SGM et Roland‑SC55.

J’ai utilisé le protocole décrit dans le message qui suit, avec comme critère d’évaluation, le rendu de l’esprit du morceau devant le timbre, même si souvent le timbre a son importance pour le rendu de l’esprit.

Dans le message qui suit encore, je donne les statistiques des notes et dans le message encore après, le détail des notes.
Le protocole.

Créer les dossiers suivants:

  • 0-HS
  • 1-Mauvais
  • 2-Moyen
  • 3-Bon
  • 4-Meilleur

Rien n’a la note zéro si ce n’est pas totalement HS. Si ça existe et que ça a les principes essentiels, ça vaut au moins 1.

Faire un premier passage en écoutant pas nécessairement tout, et déplacer dans mauvais ou moyen ce qui est vite perçu comme tel. On peut écouter jusqu’à des moments clés du morceau, ce qui typiquement correspond aux 30 à 60 premières secondes. S’il y a quelque chose de mauvais, même si c’est moyen ou bon par ailleurs, alors c’est mauvais. Le mauvais est vraiment pour ce qui a quelque chose qui gache tout. Le moyen est pour ce qui n’est pas proprement bon ou potentiellement le meilleur mais qui n’est pas proprement mauvais non‑plus. Le moyen, c’est le ni‑bon ni‑mauvais.

Ce qui reste est soit bon soit potentiellement meilleur, en général. Repasser à la recherche du meilleur en écoutant typiquement plus loin. Des choses peuvent encore être déplacées en mauvais ou moyen.

Quand après un passage plus rien n’est déplacé en moyen ou mauvais, chercher le meilleur en écoutant tous les bons potentiels jusqu’au bout. Quand le meilleur est trouvé, déplacer en meilleur le meilleur et les autres en bon.

À ce moment là, les bons et meilleurs ont tous été écoutés entièrement, les moyens et mauvais pas nécessairement entièrement.

Aller dans le dossier des moyens et les écouter entièrement pour voir si certaines ne doivent pas être rétrogradés en mauvais après écoute complète. Cette vérification est nécessaire comme ce qui est en moyen n’a pas nécessairement été entièrement écouté. L’étape peut être passée pour ce qui est en moyen et a été entièrement écouté.

Aller dans le dossier des bons et comparer au meilleur pour déplacer en meilleur ce qui en est assez proche en qualité.

Ce protocole a plusieurs caractéristiques :

  • Ce qui a le mérite d’exister (sous réserve de pertinence) ne vaut jamais zéro.
  • Ce qui est mauvais n’a pas besoin d’être évalué entièrement.
  • Il n’y a pas nécessairement que un meilleur, et même tout peut être meilleur, ça évite le blocage par des appréciations arbitraires.
  • Bon est une appréciation absolue, meilleur est une appréciation relative, même si elle n’est pas strictement hiérarchique.
Les statistiques.

Combien de fois chaque note a été donnée :

  • 0-HS : aucune fois
  • 1-MAUVAIS : 43 fois
  • 2-MOYEN : 19 fois
  • 3-BON : 1 fois
  • 4-MEILLEUR : 7 fois

Les notes obtenues par les SoundFont, où moy. signifie moyenne, dév. signifie déviation standard (ou écart type), min. la note minimum reçue par cette SoundFont, et max. sa note maximum.

  • 32MBGMStereo : moy. 1.2, dév. 0.4, min. 1, max. 2
  • AirFont 380 : moy. 1.6, dév. 0.48, min. 1, max. 2
  • Arachno : moy. 1.4, dév. 0.48, min. 1, max. 2
  • Crisis : moy. 1.2, dév. 0.4, min. 1, max. 2
  • Evanessence2 : moy. 1.8, dév. 1.16, min. 1, max. 4
  • Jurgen : moy. 1.2, dév. 0.4, min. 1, max. 2
  • Merlin : moy. 1.6, dév. 0.8, min. 1, max. 3
  • Musyng Kite : moy. 1.4, dév. 0.48, min. 1, max. 2
  • PC51 : moy. 1.4, dév. 0.48, min. 1, max. 2
  • RealFont : moy. 1.4, dév. 0.48, min. 1, max. 2
  • Roland SC‑55 : moy. 1.8, dév. 1.16, min. 1, max. 4
  • SGM : moy. 2.6, dév. 1.2, min. 1, max. 4
  • SONiVOX GS‑250 : moy. 1.0, dév. 0.0, min. 1, max. 1
  • Titanic : moy. 2.8, dév. 1.46, min. 1, max. 4

On peut voir que seulement quatre SoundFont ont obtenu au moins une fois la note maximale. Aucune n’obtient jamais plus que mauvais comme note minimale.
Détail des notes.

On peut remarquer que Boléro n’est bien rendu par aucune SoundFont. La note maximale avec ce morceau, est 2, elle est obtenue par SGM, toutes les autres SoundFont n’obtienne que 1. Je ne sais pas si c’est le fichier MIDI qui n’est pas bon ou si ce morceau est vraiment difficile à rendre correctement avec des SoundFont.

32MBGMStereo

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 1
  • Falling : 1
  • Queen : 2


AirFont 380

  • Another worlds : 2
  • Boléro : 1
  • Chronologie‑2 : 1
  • Falling : 2
  • Queen : 2


Arachno

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 2
  • Falling : 1
  • Queen : 2


Crisis

  • Another worlds : 2
  • Boléro : 1
  • Chronologie‑2 : 1
  • Falling : 1
  • Queen : 1


Evanessence‑2

  • Another worlds : 4
  • Boléro : 1
  • Chronologie‑2 : 2
  • Falling : 1
  • Queen : 1


Jurgen

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 1
  • Falling : 1
  • Queen : 2


Merlin

  • Another worlds : 3
  • Boléro : 1
  • Chronologie‑2 : 1
  • Falling : 2
  • Queen : 1


Musyng kite

  • Another worlds : 2
  • Boléro : 1
  • Chronologie‑2 : 2
  • Falling : 1
  • Queen : 1


PC51

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 2
  • Falling : 1
  • Queen : 2


RealFont

  • Another worlds : 2
  • Boléro : 1
  • Chronologie‑2 : 2
  • Falling : 1
  • Queen : 1


Roland SC‑55

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 2
  • Falling : 1
  • Queen : 4


SGM

  • Another worlds : 2
  • Boléro : 2
  • Chronologie‑2 : 4
  • Falling : 4
  • Queen : 1


SONiVOX GS‑250

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 1
  • Falling : 1
  • Queen : 1


Titanic

  • Another worlds : 1
  • Boléro : 1
  • Chronologie‑2 : 4
  • Falling : 4
  • Queen : 4
Une page qui propose plusieurs police sonores, au format SF2 (Sound Font 2, qui existe aussi en version 3), mais aussi deux au format DLS (Downloadable Sound, qui existe en version 1 et 2). DLS est défini dans les standards MIDI et est alors intéressant à cet égard.

La page proposant les échantillons sonores, avec des examples de bonnes compositions orchestrées avec, à écouter en bas de page : Uploading DLS/SF2 files to Sweet MIDI Player for iOS (ronimusic.com).

On voit qu’iel parle de fichiers DLS, alors que la majorité des fichiers sont SF2. Selon le milieux audio d’où l’on vient ou qu’on a le plus connu, l’expression qu’on utilise pour parler d’un fichier d’échantillons sonores d’instruments, peut changer. Personnellement, je préfère l’expression Sound Font, parce que le principe de ces fichiers est en effet proche de l’idée des polices de caractères pour écrire. Attention : SoundFont est une marque déposée et DLS est vraiment associé au standard MIDI, alors il ne faut pas s’approprier ses désignations, même si on peut les utiliser comme des expressions courantes. Il existe plusieurs autres formats, plus ou moins communautaires, plus ou moins standards, plus ou moins fréquents, mais là encore, les points de vue varient.

En plus des deux trouvables au premier, un autre fichier DLS qui peut servir d’exemple ou de source de tests, peut être trouvé ici : Acapella GM/GS for AWE32 and DLS (musical-artifacts.com). Choisir le lien pour le second miroir, en s’assurant que le nom du fichier se termine bien par DLS, sinon ce n’est pas le bon. Le miroir qui est sur Google Drive indique qu’il n’y a pas d’aperçu disponible, ce n’est pas une erreur, seul le téléchargement est disponible.

Le format DLS, ses deux versions jusque maintenant, est défini dans les documents fourni sur le site de la MIDI Manufacturers Association (MMA) (*) : DLS (midi.org). Un aperçu simplifié est décrit ici : Downloadable Sounds (DLS) format (recordingblogs.com). Il existe une variante officielle de ce format, pour les appareils nomades avec des ressources limitées, si encore ça a un sens à notre époque, mais c’est toujours une bonne chose de prévoir ce type de profil : Mobile DLS (midi.org).

(*) Le Japan MIDI Standards Committee (JMSC) est aussi très impliqué dans la tenue du standard MIDI.

Le format SoundFont (typiquement SF2) est défini par ce document, pour la dernière version (il en existe une de 1998 et SF3 semble spécifique à MuseScore) : SoundFont® Technical Specification (synthfont.com). Un aperçu simplifié est décrit ici : SoundFont2 Structure (mrtenz.github.io)

Il semble quand‑même y avoir des différences pas insignifiantes entre les deux formats, puisque FluidSynth, qui supporte bien les fichiers SF2, ne supporte que partiellement les fichiers DLS, ce qui n’implique pas que l’un soit tellement meilleur que l’autre, mais si l’intégration des fichiers DLS dans ou avec les fichiers MIDI est plus commode, ça peut en faire une option à favoriser.

Parce que je ne sais pas où placer ces liens à garder, ce sera dans ce message :