diff --git a/.github/workflows/ci.yml b/.github/workflows/ci.yml
index 00a963c4..1e1724af 100644
--- a/.github/workflows/ci.yml
+++ b/.github/workflows/ci.yml
@@ -25,6 +25,8 @@ jobs:
             erlang: "23.0"
     steps:
       - uses: actions/checkout@v1.0.0
+        with:
+          submodules: 'recursive'
       - name: Install dependencies
         run: |-
           apt-get update
@@ -47,9 +49,4 @@ jobs:
 
       - name: Run tests
         run: |-
-          mix test.$PARSER
-
-      - name: Run inch.report
-        run: |-
-          mix deps.get --only docs
-          MIX_ENV=docs mix inch.report
+          MIX_ENV=test mix test.$PARSER
diff --git a/.gitmodules b/.gitmodules
new file mode 100644
index 00000000..6ce64b29
--- /dev/null
+++ b/.gitmodules
@@ -0,0 +1,3 @@
+[submodule "test/html5lib-tests"]
+	path = test/html5lib-tests
+	url = https://github.com/html5lib/html5lib-tests.git
diff --git a/CHANGELOG.md b/CHANGELOG.md
index ba785f77..e0f09493 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -7,6 +7,15 @@ and this project adheres to [Semantic Versioning](http://semver.org/spec/v2.0.0.
 
 ## [Unreleased][unreleased]
 
+## [0.32.0] - 2021-10-18
+
+### Added
+
+- Add an HTML tokenizer written in Elixir - this still experimental and it's not stable API yet.
+- Add support for HTML IDs containing periods in the selectors - thanks [@Hugo-Hache](https://github.com/Hugo-Hache)
+- Add support for case-insensitive CSS attribute selectors - thanks [@fcapovilla](https://github.com/fcapovilla)
+- Add the `:root` pseudo-class selector - thanks [@fcapovilla](https://github.com/fcapovilla)
+
 ## [0.31.0] - 2021-06-11
 
 ### Changed
@@ -581,7 +590,8 @@ of the parent element inside HTML.
 
 - Elixir version requirement from "~> 1.0.0" to ">= 1.0.0".
 
-[unreleased]: https://github.com/philss/floki/compare/v0.31.0...HEAD
+[unreleased]: https://github.com/philss/floki/compare/v0.32.0...HEAD
+[0.32.0]: https://github.com/philss/floki/compare/v0.31.0...v0.32.0
 [0.31.0]: https://github.com/philss/floki/compare/v0.30.1...v0.31.0
 [0.30.1]: https://github.com/philss/floki/compare/v0.30.0...v0.30.1
 [0.30.0]: https://github.com/philss/floki/compare/v0.29.0...v0.30.0
diff --git a/README.md b/README.md
index b562a54c..d6d62d55 100644
--- a/README.md
+++ b/README.md
@@ -1,7 +1,6 @@
 [![Actions Status](https://github.com/philss/floki/workflows/CI/badge.svg?branch=master)](https://github.com/philss/floki/actions)
 [![Floki version](https://img.shields.io/hexpm/v/floki.svg)](https://hex.pm/packages/floki)
 [![Hex Docs](https://img.shields.io/badge/hex-docs-lightgreen.svg)](https://hexdocs.pm/floki/)
-[![Inline docs](https://inch-ci.org/github/philss/floki.svg?branch=master)](https://inch-ci.org/github/philss/floki)
 [![Hex.pm](https://img.shields.io/hexpm/dt/floki.svg)](https://hex.pm/packages/floki)
 [![License](https://img.shields.io/hexpm/l/floki.svg)](https://github.com/philss/floki/blob/master/LICENSE)
 [![Last Updated](https://img.shields.io/github/last-commit/philss/floki.svg)](https://github.com/philss/floki/commits/master)
@@ -62,7 +61,7 @@ Add Floki to your `mix.exs`:
 ```elixir
 defp deps do
   [
-    {:floki, "~> 0.31.0"}
+    {:floki, "~> 0.32.0"}
   ]
 end
 ```
@@ -121,8 +120,8 @@ After Rust is set up, you need to add `html5ever` NIF to your dependency list:
 ```elixir
 defp deps do
   [
-    {:floki, "~> 0.31.0"},
-    {:html5ever, "~> 0.8.0"}
+    {:floki, "~> 0.32.0"},
+    {:html5ever, "~> 0.9.0"}
   ]
 end
 ```
@@ -149,7 +148,7 @@ First, add `fast_html` to your dependencies:
 ```elixir
 defp deps do
   [
-    {:floki, "~> 0.31.0"},
+    {:floki, "~> 0.32.0"},
     {:fast_html, "~> 2.0"}
   ]
 end
@@ -250,8 +249,9 @@ Here you find all the [CSS selectors](https://www.w3.org/TR/selectors/#selectors
 | E:checked       | An E element (checkbox, radio, or option) that is checked |
 | E:disabled      | An E element (button, input, select, textarea, or option) that is disabled |
 | E.warning       | an E element whose class is "warning" |
-| E#myid          | an E element with ID equal to "myid" |
+| E#myid          | an E element with ID equal to "myid" (for ids containing periods, use `#my\\.id` or `[id="my.id"]`) |
 | E:not(s)        | an E element that does not match simple selector s |
+| :root           | the root node or nodes (in case of fragments) of the document. Most of the times this is the `html` tag |
 | E F             | an F element descendant of an E element |
 | E > F           | an F element child of an E element |
 | E + F           | an F element immediately preceded by an E element |
diff --git a/benchs/tokenizers.exs b/benchs/tokenizers.exs
new file mode 100644
index 00000000..7b492657
--- /dev/null
+++ b/benchs/tokenizers.exs
@@ -0,0 +1,34 @@
+# This benchmark compares the implementation of tokenizers
+# from mochiweb and the brand new one from Floki.
+# In order to run this, you first need to extract the
+# HTML files using the "extract.sh" script:
+#
+#   ./extract.sh
+#
+# After that, you need to run like this:
+#
+#   mix run benchs/tokenizers.exs
+#
+
+read_file = fn name ->
+  __ENV__.file
+  |> Path.dirname()
+  |> Path.join(name)
+  |> File.read!()
+end
+
+inputs = %{
+  "big" => read_file.("big.html"),
+  "medium" => read_file.("medium.html"),
+  "small" => read_file.("small.html")
+}
+
+Benchee.run(
+  %{
+    "mochiweb" => fn input -> :floki_mochi_html.tokens(input) end,
+    "floki" => fn input -> Floki.HTML.Tokenizer.tokenize(input) end
+  },
+  time: 20,
+  inputs: inputs,
+  memory_time: 4
+)
diff --git a/lib/floki/entities.ex b/lib/floki/entities.ex
new file mode 100644
index 00000000..2e1e1a0b
--- /dev/null
+++ b/lib/floki/entities.ex
@@ -0,0 +1,2242 @@
+defmodule Floki.Entities do
+  # This file was generated by "Mix.Tasks.GenerateEntities"
+
+  @moduledoc false
+
+  @doc """
+  Returns unicode codepoints for a given HTML entity.
+  """
+  @spec get(binary()) :: list(integer)
+  def get("&AElig"), do: [198]
+  def get("&AElig;"), do: [198]
+  def get("&AMP"), do: [38]
+  def get("&AMP;"), do: [38]
+  def get("&Aacute"), do: [193]
+  def get("&Aacute;"), do: [193]
+  def get("&Abreve;"), do: [258]
+  def get("&Acirc"), do: [194]
+  def get("&Acirc;"), do: [194]
+  def get("&Acy;"), do: [1040]
+  def get("&Afr;"), do: [120_068]
+  def get("&Agrave"), do: [192]
+  def get("&Agrave;"), do: [192]
+  def get("&Alpha;"), do: [913]
+  def get("&Amacr;"), do: [256]
+  def get("&And;"), do: [10835]
+  def get("&Aogon;"), do: [260]
+  def get("&Aopf;"), do: [120_120]
+  def get("&ApplyFunction;"), do: [8289]
+  def get("&Aring"), do: [197]
+  def get("&Aring;"), do: [197]
+  def get("&Ascr;"), do: [119_964]
+  def get("&Assign;"), do: [8788]
+  def get("&Atilde"), do: [195]
+  def get("&Atilde;"), do: [195]
+  def get("&Auml"), do: [196]
+  def get("&Auml;"), do: [196]
+  def get("&Backslash;"), do: [8726]
+  def get("&Barv;"), do: [10983]
+  def get("&Barwed;"), do: [8966]
+  def get("&Bcy;"), do: [1041]
+  def get("&Because;"), do: [8757]
+  def get("&Bernoullis;"), do: [8492]
+  def get("&Beta;"), do: [914]
+  def get("&Bfr;"), do: [120_069]
+  def get("&Bopf;"), do: [120_121]
+  def get("&Breve;"), do: [728]
+  def get("&Bscr;"), do: [8492]
+  def get("&Bumpeq;"), do: [8782]
+  def get("&CHcy;"), do: [1063]
+  def get("&COPY"), do: [169]
+  def get("&COPY;"), do: [169]
+  def get("&Cacute;"), do: [262]
+  def get("&Cap;"), do: [8914]
+  def get("&CapitalDifferentialD;"), do: [8517]
+  def get("&Cayleys;"), do: [8493]
+  def get("&Ccaron;"), do: [268]
+  def get("&Ccedil"), do: [199]
+  def get("&Ccedil;"), do: [199]
+  def get("&Ccirc;"), do: [264]
+  def get("&Cconint;"), do: [8752]
+  def get("&Cdot;"), do: [266]
+  def get("&Cedilla;"), do: [184]
+  def get("&CenterDot;"), do: [183]
+  def get("&Cfr;"), do: [8493]
+  def get("&Chi;"), do: [935]
+  def get("&CircleDot;"), do: [8857]
+  def get("&CircleMinus;"), do: [8854]
+  def get("&CirclePlus;"), do: [8853]
+  def get("&CircleTimes;"), do: [8855]
+  def get("&ClockwiseContourIntegral;"), do: [8754]
+  def get("&CloseCurlyDoubleQuote;"), do: [8221]
+  def get("&CloseCurlyQuote;"), do: [8217]
+  def get("&Colon;"), do: [8759]
+  def get("&Colone;"), do: [10868]
+  def get("&Congruent;"), do: [8801]
+  def get("&Conint;"), do: [8751]
+  def get("&ContourIntegral;"), do: [8750]
+  def get("&Copf;"), do: [8450]
+  def get("&Coproduct;"), do: [8720]
+  def get("&CounterClockwiseContourIntegral;"), do: [8755]
+  def get("&Cross;"), do: [10799]
+  def get("&Cscr;"), do: [119_966]
+  def get("&Cup;"), do: [8915]
+  def get("&CupCap;"), do: [8781]
+  def get("&DD;"), do: [8517]
+  def get("&DDotrahd;"), do: [10513]
+  def get("&DJcy;"), do: [1026]
+  def get("&DScy;"), do: [1029]
+  def get("&DZcy;"), do: [1039]
+  def get("&Dagger;"), do: [8225]
+  def get("&Darr;"), do: [8609]
+  def get("&Dashv;"), do: [10980]
+  def get("&Dcaron;"), do: [270]
+  def get("&Dcy;"), do: [1044]
+  def get("&Del;"), do: [8711]
+  def get("&Delta;"), do: [916]
+  def get("&Dfr;"), do: [120_071]
+  def get("&DiacriticalAcute;"), do: [180]
+  def get("&DiacriticalDot;"), do: [729]
+  def get("&DiacriticalDoubleAcute;"), do: [733]
+  def get("&DiacriticalGrave;"), do: [96]
+  def get("&DiacriticalTilde;"), do: [732]
+  def get("&Diamond;"), do: [8900]
+  def get("&DifferentialD;"), do: [8518]
+  def get("&Dopf;"), do: [120_123]
+  def get("&Dot;"), do: [168]
+  def get("&DotDot;"), do: [8412]
+  def get("&DotEqual;"), do: [8784]
+  def get("&DoubleContourIntegral;"), do: [8751]
+  def get("&DoubleDot;"), do: [168]
+  def get("&DoubleDownArrow;"), do: [8659]
+  def get("&DoubleLeftArrow;"), do: [8656]
+  def get("&DoubleLeftRightArrow;"), do: [8660]
+  def get("&DoubleLeftTee;"), do: [10980]
+  def get("&DoubleLongLeftArrow;"), do: [10232]
+  def get("&DoubleLongLeftRightArrow;"), do: [10234]
+  def get("&DoubleLongRightArrow;"), do: [10233]
+  def get("&DoubleRightArrow;"), do: [8658]
+  def get("&DoubleRightTee;"), do: [8872]
+  def get("&DoubleUpArrow;"), do: [8657]
+  def get("&DoubleUpDownArrow;"), do: [8661]
+  def get("&DoubleVerticalBar;"), do: [8741]
+  def get("&DownArrow;"), do: [8595]
+  def get("&DownArrowBar;"), do: [10515]
+  def get("&DownArrowUpArrow;"), do: [8693]
+  def get("&DownBreve;"), do: [785]
+  def get("&DownLeftRightVector;"), do: [10576]
+  def get("&DownLeftTeeVector;"), do: [10590]
+  def get("&DownLeftVector;"), do: [8637]
+  def get("&DownLeftVectorBar;"), do: [10582]
+  def get("&DownRightTeeVector;"), do: [10591]
+  def get("&DownRightVector;"), do: [8641]
+  def get("&DownRightVectorBar;"), do: [10583]
+  def get("&DownTee;"), do: [8868]
+  def get("&DownTeeArrow;"), do: [8615]
+  def get("&Downarrow;"), do: [8659]
+  def get("&Dscr;"), do: [119_967]
+  def get("&Dstrok;"), do: [272]
+  def get("&ENG;"), do: [330]
+  def get("&ETH"), do: [208]
+  def get("&ETH;"), do: [208]
+  def get("&Eacute"), do: [201]
+  def get("&Eacute;"), do: [201]
+  def get("&Ecaron;"), do: [282]
+  def get("&Ecirc"), do: [202]
+  def get("&Ecirc;"), do: [202]
+  def get("&Ecy;"), do: [1069]
+  def get("&Edot;"), do: [278]
+  def get("&Efr;"), do: [120_072]
+  def get("&Egrave"), do: [200]
+  def get("&Egrave;"), do: [200]
+  def get("&Element;"), do: [8712]
+  def get("&Emacr;"), do: [274]
+  def get("&EmptySmallSquare;"), do: [9723]
+  def get("&EmptyVerySmallSquare;"), do: [9643]
+  def get("&Eogon;"), do: [280]
+  def get("&Eopf;"), do: [120_124]
+  def get("&Epsilon;"), do: [917]
+  def get("&Equal;"), do: [10869]
+  def get("&EqualTilde;"), do: [8770]
+  def get("&Equilibrium;"), do: [8652]
+  def get("&Escr;"), do: [8496]
+  def get("&Esim;"), do: [10867]
+  def get("&Eta;"), do: [919]
+  def get("&Euml"), do: [203]
+  def get("&Euml;"), do: [203]
+  def get("&Exists;"), do: [8707]
+  def get("&ExponentialE;"), do: [8519]
+  def get("&Fcy;"), do: [1060]
+  def get("&Ffr;"), do: [120_073]
+  def get("&FilledSmallSquare;"), do: [9724]
+  def get("&FilledVerySmallSquare;"), do: [9642]
+  def get("&Fopf;"), do: [120_125]
+  def get("&ForAll;"), do: [8704]
+  def get("&Fouriertrf;"), do: [8497]
+  def get("&Fscr;"), do: [8497]
+  def get("&GJcy;"), do: [1027]
+  def get("&GT"), do: [62]
+  def get("&GT;"), do: [62]
+  def get("&Gamma;"), do: [915]
+  def get("&Gammad;"), do: [988]
+  def get("&Gbreve;"), do: [286]
+  def get("&Gcedil;"), do: [290]
+  def get("&Gcirc;"), do: [284]
+  def get("&Gcy;"), do: [1043]
+  def get("&Gdot;"), do: [288]
+  def get("&Gfr;"), do: [120_074]
+  def get("&Gg;"), do: [8921]
+  def get("&Gopf;"), do: [120_126]
+  def get("&GreaterEqual;"), do: [8805]
+  def get("&GreaterEqualLess;"), do: [8923]
+  def get("&GreaterFullEqual;"), do: [8807]
+  def get("&GreaterGreater;"), do: [10914]
+  def get("&GreaterLess;"), do: [8823]
+  def get("&GreaterSlantEqual;"), do: [10878]
+  def get("&GreaterTilde;"), do: [8819]
+  def get("&Gscr;"), do: [119_970]
+  def get("&Gt;"), do: [8811]
+  def get("&HARDcy;"), do: [1066]
+  def get("&Hacek;"), do: [711]
+  def get("&Hat;"), do: [94]
+  def get("&Hcirc;"), do: [292]
+  def get("&Hfr;"), do: [8460]
+  def get("&HilbertSpace;"), do: [8459]
+  def get("&Hopf;"), do: [8461]
+  def get("&HorizontalLine;"), do: [9472]
+  def get("&Hscr;"), do: [8459]
+  def get("&Hstrok;"), do: [294]
+  def get("&HumpDownHump;"), do: [8782]
+  def get("&HumpEqual;"), do: [8783]
+  def get("&IEcy;"), do: [1045]
+  def get("&IJlig;"), do: [306]
+  def get("&IOcy;"), do: [1025]
+  def get("&Iacute"), do: [205]
+  def get("&Iacute;"), do: [205]
+  def get("&Icirc"), do: [206]
+  def get("&Icirc;"), do: [206]
+  def get("&Icy;"), do: [1048]
+  def get("&Idot;"), do: [304]
+  def get("&Ifr;"), do: [8465]
+  def get("&Igrave"), do: [204]
+  def get("&Igrave;"), do: [204]
+  def get("&Im;"), do: [8465]
+  def get("&Imacr;"), do: [298]
+  def get("&ImaginaryI;"), do: [8520]
+  def get("&Implies;"), do: [8658]
+  def get("&Int;"), do: [8748]
+  def get("&Integral;"), do: [8747]
+  def get("&Intersection;"), do: [8898]
+  def get("&InvisibleComma;"), do: [8291]
+  def get("&InvisibleTimes;"), do: [8290]
+  def get("&Iogon;"), do: [302]
+  def get("&Iopf;"), do: [120_128]
+  def get("&Iota;"), do: [921]
+  def get("&Iscr;"), do: [8464]
+  def get("&Itilde;"), do: [296]
+  def get("&Iukcy;"), do: [1030]
+  def get("&Iuml"), do: [207]
+  def get("&Iuml;"), do: [207]
+  def get("&Jcirc;"), do: [308]
+  def get("&Jcy;"), do: [1049]
+  def get("&Jfr;"), do: [120_077]
+  def get("&Jopf;"), do: [120_129]
+  def get("&Jscr;"), do: [119_973]
+  def get("&Jsercy;"), do: [1032]
+  def get("&Jukcy;"), do: [1028]
+  def get("&KHcy;"), do: [1061]
+  def get("&KJcy;"), do: [1036]
+  def get("&Kappa;"), do: [922]
+  def get("&Kcedil;"), do: [310]
+  def get("&Kcy;"), do: [1050]
+  def get("&Kfr;"), do: [120_078]
+  def get("&Kopf;"), do: [120_130]
+  def get("&Kscr;"), do: [119_974]
+  def get("&LJcy;"), do: [1033]
+  def get("&LT"), do: [60]
+  def get("&LT;"), do: [60]
+  def get("&Lacute;"), do: [313]
+  def get("&Lambda;"), do: [923]
+  def get("&Lang;"), do: [10218]
+  def get("&Laplacetrf;"), do: [8466]
+  def get("&Larr;"), do: [8606]
+  def get("&Lcaron;"), do: [317]
+  def get("&Lcedil;"), do: [315]
+  def get("&Lcy;"), do: [1051]
+  def get("&LeftAngleBracket;"), do: [10216]
+  def get("&LeftArrow;"), do: [8592]
+  def get("&LeftArrowBar;"), do: [8676]
+  def get("&LeftArrowRightArrow;"), do: [8646]
+  def get("&LeftCeiling;"), do: [8968]
+  def get("&LeftDoubleBracket;"), do: [10214]
+  def get("&LeftDownTeeVector;"), do: [10593]
+  def get("&LeftDownVector;"), do: [8643]
+  def get("&LeftDownVectorBar;"), do: [10585]
+  def get("&LeftFloor;"), do: [8970]
+  def get("&LeftRightArrow;"), do: [8596]
+  def get("&LeftRightVector;"), do: [10574]
+  def get("&LeftTee;"), do: [8867]
+  def get("&LeftTeeArrow;"), do: [8612]
+  def get("&LeftTeeVector;"), do: [10586]
+  def get("&LeftTriangle;"), do: [8882]
+  def get("&LeftTriangleBar;"), do: [10703]
+  def get("&LeftTriangleEqual;"), do: [8884]
+  def get("&LeftUpDownVector;"), do: [10577]
+  def get("&LeftUpTeeVector;"), do: [10592]
+  def get("&LeftUpVector;"), do: [8639]
+  def get("&LeftUpVectorBar;"), do: [10584]
+  def get("&LeftVector;"), do: [8636]
+  def get("&LeftVectorBar;"), do: [10578]
+  def get("&Leftarrow;"), do: [8656]
+  def get("&Leftrightarrow;"), do: [8660]
+  def get("&LessEqualGreater;"), do: [8922]
+  def get("&LessFullEqual;"), do: [8806]
+  def get("&LessGreater;"), do: [8822]
+  def get("&LessLess;"), do: [10913]
+  def get("&LessSlantEqual;"), do: [10877]
+  def get("&LessTilde;"), do: [8818]
+  def get("&Lfr;"), do: [120_079]
+  def get("&Ll;"), do: [8920]
+  def get("&Lleftarrow;"), do: [8666]
+  def get("&Lmidot;"), do: [319]
+  def get("&LongLeftArrow;"), do: [10229]
+  def get("&LongLeftRightArrow;"), do: [10231]
+  def get("&LongRightArrow;"), do: [10230]
+  def get("&Longleftarrow;"), do: [10232]
+  def get("&Longleftrightarrow;"), do: [10234]
+  def get("&Longrightarrow;"), do: [10233]
+  def get("&Lopf;"), do: [120_131]
+  def get("&LowerLeftArrow;"), do: [8601]
+  def get("&LowerRightArrow;"), do: [8600]
+  def get("&Lscr;"), do: [8466]
+  def get("&Lsh;"), do: [8624]
+  def get("&Lstrok;"), do: [321]
+  def get("&Lt;"), do: [8810]
+  def get("&Map;"), do: [10501]
+  def get("&Mcy;"), do: [1052]
+  def get("&MediumSpace;"), do: [8287]
+  def get("&Mellintrf;"), do: [8499]
+  def get("&Mfr;"), do: [120_080]
+  def get("&MinusPlus;"), do: [8723]
+  def get("&Mopf;"), do: [120_132]
+  def get("&Mscr;"), do: [8499]
+  def get("&Mu;"), do: [924]
+  def get("&NJcy;"), do: [1034]
+  def get("&Nacute;"), do: [323]
+  def get("&Ncaron;"), do: [327]
+  def get("&Ncedil;"), do: [325]
+  def get("&Ncy;"), do: [1053]
+  def get("&NegativeMediumSpace;"), do: [8203]
+  def get("&NegativeThickSpace;"), do: [8203]
+  def get("&NegativeThinSpace;"), do: [8203]
+  def get("&NegativeVeryThinSpace;"), do: [8203]
+  def get("&NestedGreaterGreater;"), do: [8811]
+  def get("&NestedLessLess;"), do: [8810]
+  def get("&NewLine;"), do: [10]
+  def get("&Nfr;"), do: [120_081]
+  def get("&NoBreak;"), do: [8288]
+  def get("&NonBreakingSpace;"), do: [160]
+  def get("&Nopf;"), do: [8469]
+  def get("&Not;"), do: [10988]
+  def get("&NotCongruent;"), do: [8802]
+  def get("&NotCupCap;"), do: [8813]
+  def get("&NotDoubleVerticalBar;"), do: [8742]
+  def get("&NotElement;"), do: [8713]
+  def get("&NotEqual;"), do: [8800]
+  def get("&NotEqualTilde;"), do: [8770, 824]
+  def get("&NotExists;"), do: [8708]
+  def get("&NotGreater;"), do: [8815]
+  def get("&NotGreaterEqual;"), do: [8817]
+  def get("&NotGreaterFullEqual;"), do: [8807, 824]
+  def get("&NotGreaterGreater;"), do: [8811, 824]
+  def get("&NotGreaterLess;"), do: [8825]
+  def get("&NotGreaterSlantEqual;"), do: [10878, 824]
+  def get("&NotGreaterTilde;"), do: [8821]
+  def get("&NotHumpDownHump;"), do: [8782, 824]
+  def get("&NotHumpEqual;"), do: [8783, 824]
+  def get("&NotLeftTriangle;"), do: [8938]
+  def get("&NotLeftTriangleBar;"), do: [10703, 824]
+  def get("&NotLeftTriangleEqual;"), do: [8940]
+  def get("&NotLess;"), do: [8814]
+  def get("&NotLessEqual;"), do: [8816]
+  def get("&NotLessGreater;"), do: [8824]
+  def get("&NotLessLess;"), do: [8810, 824]
+  def get("&NotLessSlantEqual;"), do: [10877, 824]
+  def get("&NotLessTilde;"), do: [8820]
+  def get("&NotNestedGreaterGreater;"), do: [10914, 824]
+  def get("&NotNestedLessLess;"), do: [10913, 824]
+  def get("&NotPrecedes;"), do: [8832]
+  def get("&NotPrecedesEqual;"), do: [10927, 824]
+  def get("&NotPrecedesSlantEqual;"), do: [8928]
+  def get("&NotReverseElement;"), do: [8716]
+  def get("&NotRightTriangle;"), do: [8939]
+  def get("&NotRightTriangleBar;"), do: [10704, 824]
+  def get("&NotRightTriangleEqual;"), do: [8941]
+  def get("&NotSquareSubset;"), do: [8847, 824]
+  def get("&NotSquareSubsetEqual;"), do: [8930]
+  def get("&NotSquareSuperset;"), do: [8848, 824]
+  def get("&NotSquareSupersetEqual;"), do: [8931]
+  def get("&NotSubset;"), do: [8834, 8402]
+  def get("&NotSubsetEqual;"), do: [8840]
+  def get("&NotSucceeds;"), do: [8833]
+  def get("&NotSucceedsEqual;"), do: [10928, 824]
+  def get("&NotSucceedsSlantEqual;"), do: [8929]
+  def get("&NotSucceedsTilde;"), do: [8831, 824]
+  def get("&NotSuperset;"), do: [8835, 8402]
+  def get("&NotSupersetEqual;"), do: [8841]
+  def get("&NotTilde;"), do: [8769]
+  def get("&NotTildeEqual;"), do: [8772]
+  def get("&NotTildeFullEqual;"), do: [8775]
+  def get("&NotTildeTilde;"), do: [8777]
+  def get("&NotVerticalBar;"), do: [8740]
+  def get("&Nscr;"), do: [119_977]
+  def get("&Ntilde"), do: [209]
+  def get("&Ntilde;"), do: [209]
+  def get("&Nu;"), do: [925]
+  def get("&OElig;"), do: [338]
+  def get("&Oacute"), do: [211]
+  def get("&Oacute;"), do: [211]
+  def get("&Ocirc"), do: [212]
+  def get("&Ocirc;"), do: [212]
+  def get("&Ocy;"), do: [1054]
+  def get("&Odblac;"), do: [336]
+  def get("&Ofr;"), do: [120_082]
+  def get("&Ograve"), do: [210]
+  def get("&Ograve;"), do: [210]
+  def get("&Omacr;"), do: [332]
+  def get("&Omega;"), do: [937]
+  def get("&Omicron;"), do: [927]
+  def get("&Oopf;"), do: [120_134]
+  def get("&OpenCurlyDoubleQuote;"), do: [8220]
+  def get("&OpenCurlyQuote;"), do: [8216]
+  def get("&Or;"), do: [10836]
+  def get("&Oscr;"), do: [119_978]
+  def get("&Oslash"), do: [216]
+  def get("&Oslash;"), do: [216]
+  def get("&Otilde"), do: [213]
+  def get("&Otilde;"), do: [213]
+  def get("&Otimes;"), do: [10807]
+  def get("&Ouml"), do: [214]
+  def get("&Ouml;"), do: [214]
+  def get("&OverBar;"), do: [8254]
+  def get("&OverBrace;"), do: [9182]
+  def get("&OverBracket;"), do: [9140]
+  def get("&OverParenthesis;"), do: [9180]
+  def get("&PartialD;"), do: [8706]
+  def get("&Pcy;"), do: [1055]
+  def get("&Pfr;"), do: [120_083]
+  def get("&Phi;"), do: [934]
+  def get("&Pi;"), do: [928]
+  def get("&PlusMinus;"), do: [177]
+  def get("&Poincareplane;"), do: [8460]
+  def get("&Popf;"), do: [8473]
+  def get("&Pr;"), do: [10939]
+  def get("&Precedes;"), do: [8826]
+  def get("&PrecedesEqual;"), do: [10927]
+  def get("&PrecedesSlantEqual;"), do: [8828]
+  def get("&PrecedesTilde;"), do: [8830]
+  def get("&Prime;"), do: [8243]
+  def get("&Product;"), do: [8719]
+  def get("&Proportion;"), do: [8759]
+  def get("&Proportional;"), do: [8733]
+  def get("&Pscr;"), do: [119_979]
+  def get("&Psi;"), do: [936]
+  def get("&QUOT"), do: [34]
+  def get("&QUOT;"), do: [34]
+  def get("&Qfr;"), do: [120_084]
+  def get("&Qopf;"), do: [8474]
+  def get("&Qscr;"), do: [119_980]
+  def get("&RBarr;"), do: [10512]
+  def get("&REG"), do: [174]
+  def get("&REG;"), do: [174]
+  def get("&Racute;"), do: [340]
+  def get("&Rang;"), do: [10219]
+  def get("&Rarr;"), do: [8608]
+  def get("&Rarrtl;"), do: [10518]
+  def get("&Rcaron;"), do: [344]
+  def get("&Rcedil;"), do: [342]
+  def get("&Rcy;"), do: [1056]
+  def get("&Re;"), do: [8476]
+  def get("&ReverseElement;"), do: [8715]
+  def get("&ReverseEquilibrium;"), do: [8651]
+  def get("&ReverseUpEquilibrium;"), do: [10607]
+  def get("&Rfr;"), do: [8476]
+  def get("&Rho;"), do: [929]
+  def get("&RightAngleBracket;"), do: [10217]
+  def get("&RightArrow;"), do: [8594]
+  def get("&RightArrowBar;"), do: [8677]
+  def get("&RightArrowLeftArrow;"), do: [8644]
+  def get("&RightCeiling;"), do: [8969]
+  def get("&RightDoubleBracket;"), do: [10215]
+  def get("&RightDownTeeVector;"), do: [10589]
+  def get("&RightDownVector;"), do: [8642]
+  def get("&RightDownVectorBar;"), do: [10581]
+  def get("&RightFloor;"), do: [8971]
+  def get("&RightTee;"), do: [8866]
+  def get("&RightTeeArrow;"), do: [8614]
+  def get("&RightTeeVector;"), do: [10587]
+  def get("&RightTriangle;"), do: [8883]
+  def get("&RightTriangleBar;"), do: [10704]
+  def get("&RightTriangleEqual;"), do: [8885]
+  def get("&RightUpDownVector;"), do: [10575]
+  def get("&RightUpTeeVector;"), do: [10588]
+  def get("&RightUpVector;"), do: [8638]
+  def get("&RightUpVectorBar;"), do: [10580]
+  def get("&RightVector;"), do: [8640]
+  def get("&RightVectorBar;"), do: [10579]
+  def get("&Rightarrow;"), do: [8658]
+  def get("&Ropf;"), do: [8477]
+  def get("&RoundImplies;"), do: [10608]
+  def get("&Rrightarrow;"), do: [8667]
+  def get("&Rscr;"), do: [8475]
+  def get("&Rsh;"), do: [8625]
+  def get("&RuleDelayed;"), do: [10740]
+  def get("&SHCHcy;"), do: [1065]
+  def get("&SHcy;"), do: [1064]
+  def get("&SOFTcy;"), do: [1068]
+  def get("&Sacute;"), do: [346]
+  def get("&Sc;"), do: [10940]
+  def get("&Scaron;"), do: [352]
+  def get("&Scedil;"), do: [350]
+  def get("&Scirc;"), do: [348]
+  def get("&Scy;"), do: [1057]
+  def get("&Sfr;"), do: [120_086]
+  def get("&ShortDownArrow;"), do: [8595]
+  def get("&ShortLeftArrow;"), do: [8592]
+  def get("&ShortRightArrow;"), do: [8594]
+  def get("&ShortUpArrow;"), do: [8593]
+  def get("&Sigma;"), do: [931]
+  def get("&SmallCircle;"), do: [8728]
+  def get("&Sopf;"), do: [120_138]
+  def get("&Sqrt;"), do: [8730]
+  def get("&Square;"), do: [9633]
+  def get("&SquareIntersection;"), do: [8851]
+  def get("&SquareSubset;"), do: [8847]
+  def get("&SquareSubsetEqual;"), do: [8849]
+  def get("&SquareSuperset;"), do: [8848]
+  def get("&SquareSupersetEqual;"), do: [8850]
+  def get("&SquareUnion;"), do: [8852]
+  def get("&Sscr;"), do: [119_982]
+  def get("&Star;"), do: [8902]
+  def get("&Sub;"), do: [8912]
+  def get("&Subset;"), do: [8912]
+  def get("&SubsetEqual;"), do: [8838]
+  def get("&Succeeds;"), do: [8827]
+  def get("&SucceedsEqual;"), do: [10928]
+  def get("&SucceedsSlantEqual;"), do: [8829]
+  def get("&SucceedsTilde;"), do: [8831]
+  def get("&SuchThat;"), do: [8715]
+  def get("&Sum;"), do: [8721]
+  def get("&Sup;"), do: [8913]
+  def get("&Superset;"), do: [8835]
+  def get("&SupersetEqual;"), do: [8839]
+  def get("&Supset;"), do: [8913]
+  def get("&THORN"), do: [222]
+  def get("&THORN;"), do: [222]
+  def get("&TRADE;"), do: [8482]
+  def get("&TSHcy;"), do: [1035]
+  def get("&TScy;"), do: [1062]
+  def get("&Tab;"), do: [9]
+  def get("&Tau;"), do: [932]
+  def get("&Tcaron;"), do: [356]
+  def get("&Tcedil;"), do: [354]
+  def get("&Tcy;"), do: [1058]
+  def get("&Tfr;"), do: [120_087]
+  def get("&Therefore;"), do: [8756]
+  def get("&Theta;"), do: [920]
+  def get("&ThickSpace;"), do: [8287, 8202]
+  def get("&ThinSpace;"), do: [8201]
+  def get("&Tilde;"), do: [8764]
+  def get("&TildeEqual;"), do: [8771]
+  def get("&TildeFullEqual;"), do: [8773]
+  def get("&TildeTilde;"), do: [8776]
+  def get("&Topf;"), do: [120_139]
+  def get("&TripleDot;"), do: [8411]
+  def get("&Tscr;"), do: [119_983]
+  def get("&Tstrok;"), do: [358]
+  def get("&Uacute"), do: [218]
+  def get("&Uacute;"), do: [218]
+  def get("&Uarr;"), do: [8607]
+  def get("&Uarrocir;"), do: [10569]
+  def get("&Ubrcy;"), do: [1038]
+  def get("&Ubreve;"), do: [364]
+  def get("&Ucirc"), do: [219]
+  def get("&Ucirc;"), do: [219]
+  def get("&Ucy;"), do: [1059]
+  def get("&Udblac;"), do: [368]
+  def get("&Ufr;"), do: [120_088]
+  def get("&Ugrave"), do: [217]
+  def get("&Ugrave;"), do: [217]
+  def get("&Umacr;"), do: [362]
+  def get("&UnderBar;"), do: [95]
+  def get("&UnderBrace;"), do: [9183]
+  def get("&UnderBracket;"), do: [9141]
+  def get("&UnderParenthesis;"), do: [9181]
+  def get("&Union;"), do: [8899]
+  def get("&UnionPlus;"), do: [8846]
+  def get("&Uogon;"), do: [370]
+  def get("&Uopf;"), do: [120_140]
+  def get("&UpArrow;"), do: [8593]
+  def get("&UpArrowBar;"), do: [10514]
+  def get("&UpArrowDownArrow;"), do: [8645]
+  def get("&UpDownArrow;"), do: [8597]
+  def get("&UpEquilibrium;"), do: [10606]
+  def get("&UpTee;"), do: [8869]
+  def get("&UpTeeArrow;"), do: [8613]
+  def get("&Uparrow;"), do: [8657]
+  def get("&Updownarrow;"), do: [8661]
+  def get("&UpperLeftArrow;"), do: [8598]
+  def get("&UpperRightArrow;"), do: [8599]
+  def get("&Upsi;"), do: [978]
+  def get("&Upsilon;"), do: [933]
+  def get("&Uring;"), do: [366]
+  def get("&Uscr;"), do: [119_984]
+  def get("&Utilde;"), do: [360]
+  def get("&Uuml"), do: [220]
+  def get("&Uuml;"), do: [220]
+  def get("&VDash;"), do: [8875]
+  def get("&Vbar;"), do: [10987]
+  def get("&Vcy;"), do: [1042]
+  def get("&Vdash;"), do: [8873]
+  def get("&Vdashl;"), do: [10982]
+  def get("&Vee;"), do: [8897]
+  def get("&Verbar;"), do: [8214]
+  def get("&Vert;"), do: [8214]
+  def get("&VerticalBar;"), do: [8739]
+  def get("&VerticalLine;"), do: [124]
+  def get("&VerticalSeparator;"), do: [10072]
+  def get("&VerticalTilde;"), do: [8768]
+  def get("&VeryThinSpace;"), do: [8202]
+  def get("&Vfr;"), do: [120_089]
+  def get("&Vopf;"), do: [120_141]
+  def get("&Vscr;"), do: [119_985]
+  def get("&Vvdash;"), do: [8874]
+  def get("&Wcirc;"), do: [372]
+  def get("&Wedge;"), do: [8896]
+  def get("&Wfr;"), do: [120_090]
+  def get("&Wopf;"), do: [120_142]
+  def get("&Wscr;"), do: [119_986]
+  def get("&Xfr;"), do: [120_091]
+  def get("&Xi;"), do: [926]
+  def get("&Xopf;"), do: [120_143]
+  def get("&Xscr;"), do: [119_987]
+  def get("&YAcy;"), do: [1071]
+  def get("&YIcy;"), do: [1031]
+  def get("&YUcy;"), do: [1070]
+  def get("&Yacute"), do: [221]
+  def get("&Yacute;"), do: [221]
+  def get("&Ycirc;"), do: [374]
+  def get("&Ycy;"), do: [1067]
+  def get("&Yfr;"), do: [120_092]
+  def get("&Yopf;"), do: [120_144]
+  def get("&Yscr;"), do: [119_988]
+  def get("&Yuml;"), do: [376]
+  def get("&ZHcy;"), do: [1046]
+  def get("&Zacute;"), do: [377]
+  def get("&Zcaron;"), do: [381]
+  def get("&Zcy;"), do: [1047]
+  def get("&Zdot;"), do: [379]
+  def get("&ZeroWidthSpace;"), do: [8203]
+  def get("&Zeta;"), do: [918]
+  def get("&Zfr;"), do: [8488]
+  def get("&Zopf;"), do: [8484]
+  def get("&Zscr;"), do: [119_989]
+  def get("&aacute"), do: [225]
+  def get("&aacute;"), do: [225]
+  def get("&abreve;"), do: [259]
+  def get("&ac;"), do: [8766]
+  def get("&acE;"), do: [8766, 819]
+  def get("&acd;"), do: [8767]
+  def get("&acirc"), do: [226]
+  def get("&acirc;"), do: [226]
+  def get("&acute"), do: [180]
+  def get("&acute;"), do: [180]
+  def get("&acy;"), do: [1072]
+  def get("&aelig"), do: [230]
+  def get("&aelig;"), do: [230]
+  def get("&af;"), do: [8289]
+  def get("&afr;"), do: [120_094]
+  def get("&agrave"), do: [224]
+  def get("&agrave;"), do: [224]
+  def get("&alefsym;"), do: [8501]
+  def get("&aleph;"), do: [8501]
+  def get("&alpha;"), do: [945]
+  def get("&amacr;"), do: [257]
+  def get("&amalg;"), do: [10815]
+  def get("&amp"), do: [38]
+  def get("&amp;"), do: [38]
+  def get("&and;"), do: [8743]
+  def get("&andand;"), do: [10837]
+  def get("&andd;"), do: [10844]
+  def get("&andslope;"), do: [10840]
+  def get("&andv;"), do: [10842]
+  def get("&ang;"), do: [8736]
+  def get("&ange;"), do: [10660]
+  def get("&angle;"), do: [8736]
+  def get("&angmsd;"), do: [8737]
+  def get("&angmsdaa;"), do: [10664]
+  def get("&angmsdab;"), do: [10665]
+  def get("&angmsdac;"), do: [10666]
+  def get("&angmsdad;"), do: [10667]
+  def get("&angmsdae;"), do: [10668]
+  def get("&angmsdaf;"), do: [10669]
+  def get("&angmsdag;"), do: [10670]
+  def get("&angmsdah;"), do: [10671]
+  def get("&angrt;"), do: [8735]
+  def get("&angrtvb;"), do: [8894]
+  def get("&angrtvbd;"), do: [10653]
+  def get("&angsph;"), do: [8738]
+  def get("&angst;"), do: [197]
+  def get("&angzarr;"), do: [9084]
+  def get("&aogon;"), do: [261]
+  def get("&aopf;"), do: [120_146]
+  def get("&ap;"), do: [8776]
+  def get("&apE;"), do: [10864]
+  def get("&apacir;"), do: [10863]
+  def get("&ape;"), do: [8778]
+  def get("&apid;"), do: [8779]
+  def get("&apos;"), do: [39]
+  def get("&approx;"), do: [8776]
+  def get("&approxeq;"), do: [8778]
+  def get("&aring"), do: [229]
+  def get("&aring;"), do: [229]
+  def get("&ascr;"), do: [119_990]
+  def get("&ast;"), do: [42]
+  def get("&asymp;"), do: [8776]
+  def get("&asympeq;"), do: [8781]
+  def get("&atilde"), do: [227]
+  def get("&atilde;"), do: [227]
+  def get("&auml"), do: [228]
+  def get("&auml;"), do: [228]
+  def get("&awconint;"), do: [8755]
+  def get("&awint;"), do: [10769]
+  def get("&bNot;"), do: [10989]
+  def get("&backcong;"), do: [8780]
+  def get("&backepsilon;"), do: [1014]
+  def get("&backprime;"), do: [8245]
+  def get("&backsim;"), do: [8765]
+  def get("&backsimeq;"), do: [8909]
+  def get("&barvee;"), do: [8893]
+  def get("&barwed;"), do: [8965]
+  def get("&barwedge;"), do: [8965]
+  def get("&bbrk;"), do: [9141]
+  def get("&bbrktbrk;"), do: [9142]
+  def get("&bcong;"), do: [8780]
+  def get("&bcy;"), do: [1073]
+  def get("&bdquo;"), do: [8222]
+  def get("&becaus;"), do: [8757]
+  def get("&because;"), do: [8757]
+  def get("&bemptyv;"), do: [10672]
+  def get("&bepsi;"), do: [1014]
+  def get("&bernou;"), do: [8492]
+  def get("&beta;"), do: [946]
+  def get("&beth;"), do: [8502]
+  def get("&between;"), do: [8812]
+  def get("&bfr;"), do: [120_095]
+  def get("&bigcap;"), do: [8898]
+  def get("&bigcirc;"), do: [9711]
+  def get("&bigcup;"), do: [8899]
+  def get("&bigodot;"), do: [10752]
+  def get("&bigoplus;"), do: [10753]
+  def get("&bigotimes;"), do: [10754]
+  def get("&bigsqcup;"), do: [10758]
+  def get("&bigstar;"), do: [9733]
+  def get("&bigtriangledown;"), do: [9661]
+  def get("&bigtriangleup;"), do: [9651]
+  def get("&biguplus;"), do: [10756]
+  def get("&bigvee;"), do: [8897]
+  def get("&bigwedge;"), do: [8896]
+  def get("&bkarow;"), do: [10509]
+  def get("&blacklozenge;"), do: [10731]
+  def get("&blacksquare;"), do: [9642]
+  def get("&blacktriangle;"), do: [9652]
+  def get("&blacktriangledown;"), do: [9662]
+  def get("&blacktriangleleft;"), do: [9666]
+  def get("&blacktriangleright;"), do: [9656]
+  def get("&blank;"), do: [9251]
+  def get("&blk12;"), do: [9618]
+  def get("&blk14;"), do: [9617]
+  def get("&blk34;"), do: [9619]
+  def get("&block;"), do: [9608]
+  def get("&bne;"), do: [61, 8421]
+  def get("&bnequiv;"), do: [8801, 8421]
+  def get("&bnot;"), do: [8976]
+  def get("&bopf;"), do: [120_147]
+  def get("&bot;"), do: [8869]
+  def get("&bottom;"), do: [8869]
+  def get("&bowtie;"), do: [8904]
+  def get("&boxDL;"), do: [9559]
+  def get("&boxDR;"), do: [9556]
+  def get("&boxDl;"), do: [9558]
+  def get("&boxDr;"), do: [9555]
+  def get("&boxH;"), do: [9552]
+  def get("&boxHD;"), do: [9574]
+  def get("&boxHU;"), do: [9577]
+  def get("&boxHd;"), do: [9572]
+  def get("&boxHu;"), do: [9575]
+  def get("&boxUL;"), do: [9565]
+  def get("&boxUR;"), do: [9562]
+  def get("&boxUl;"), do: [9564]
+  def get("&boxUr;"), do: [9561]
+  def get("&boxV;"), do: [9553]
+  def get("&boxVH;"), do: [9580]
+  def get("&boxVL;"), do: [9571]
+  def get("&boxVR;"), do: [9568]
+  def get("&boxVh;"), do: [9579]
+  def get("&boxVl;"), do: [9570]
+  def get("&boxVr;"), do: [9567]
+  def get("&boxbox;"), do: [10697]
+  def get("&boxdL;"), do: [9557]
+  def get("&boxdR;"), do: [9554]
+  def get("&boxdl;"), do: [9488]
+  def get("&boxdr;"), do: [9484]
+  def get("&boxh;"), do: [9472]
+  def get("&boxhD;"), do: [9573]
+  def get("&boxhU;"), do: [9576]
+  def get("&boxhd;"), do: [9516]
+  def get("&boxhu;"), do: [9524]
+  def get("&boxminus;"), do: [8863]
+  def get("&boxplus;"), do: [8862]
+  def get("&boxtimes;"), do: [8864]
+  def get("&boxuL;"), do: [9563]
+  def get("&boxuR;"), do: [9560]
+  def get("&boxul;"), do: [9496]
+  def get("&boxur;"), do: [9492]
+  def get("&boxv;"), do: [9474]
+  def get("&boxvH;"), do: [9578]
+  def get("&boxvL;"), do: [9569]
+  def get("&boxvR;"), do: [9566]
+  def get("&boxvh;"), do: [9532]
+  def get("&boxvl;"), do: [9508]
+  def get("&boxvr;"), do: [9500]
+  def get("&bprime;"), do: [8245]
+  def get("&breve;"), do: [728]
+  def get("&brvbar"), do: [166]
+  def get("&brvbar;"), do: [166]
+  def get("&bscr;"), do: [119_991]
+  def get("&bsemi;"), do: [8271]
+  def get("&bsim;"), do: [8765]
+  def get("&bsime;"), do: [8909]
+  def get("&bsol;"), do: [92]
+  def get("&bsolb;"), do: [10693]
+  def get("&bsolhsub;"), do: [10184]
+  def get("&bull;"), do: [8226]
+  def get("&bullet;"), do: [8226]
+  def get("&bump;"), do: [8782]
+  def get("&bumpE;"), do: [10926]
+  def get("&bumpe;"), do: [8783]
+  def get("&bumpeq;"), do: [8783]
+  def get("&cacute;"), do: [263]
+  def get("&cap;"), do: [8745]
+  def get("&capand;"), do: [10820]
+  def get("&capbrcup;"), do: [10825]
+  def get("&capcap;"), do: [10827]
+  def get("&capcup;"), do: [10823]
+  def get("&capdot;"), do: [10816]
+  def get("&caps;"), do: [8745, 65024]
+  def get("&caret;"), do: [8257]
+  def get("&caron;"), do: [711]
+  def get("&ccaps;"), do: [10829]
+  def get("&ccaron;"), do: [269]
+  def get("&ccedil"), do: [231]
+  def get("&ccedil;"), do: [231]
+  def get("&ccirc;"), do: [265]
+  def get("&ccups;"), do: [10828]
+  def get("&ccupssm;"), do: [10832]
+  def get("&cdot;"), do: [267]
+  def get("&cedil"), do: [184]
+  def get("&cedil;"), do: [184]
+  def get("&cemptyv;"), do: [10674]
+  def get("&cent"), do: [162]
+  def get("&cent;"), do: [162]
+  def get("&centerdot;"), do: [183]
+  def get("&cfr;"), do: [120_096]
+  def get("&chcy;"), do: [1095]
+  def get("&check;"), do: [10003]
+  def get("&checkmark;"), do: [10003]
+  def get("&chi;"), do: [967]
+  def get("&cir;"), do: [9675]
+  def get("&cirE;"), do: [10691]
+  def get("&circ;"), do: [710]
+  def get("&circeq;"), do: [8791]
+  def get("&circlearrowleft;"), do: [8634]
+  def get("&circlearrowright;"), do: [8635]
+  def get("&circledR;"), do: [174]
+  def get("&circledS;"), do: [9416]
+  def get("&circledast;"), do: [8859]
+  def get("&circledcirc;"), do: [8858]
+  def get("&circleddash;"), do: [8861]
+  def get("&cire;"), do: [8791]
+  def get("&cirfnint;"), do: [10768]
+  def get("&cirmid;"), do: [10991]
+  def get("&cirscir;"), do: [10690]
+  def get("&clubs;"), do: [9827]
+  def get("&clubsuit;"), do: [9827]
+  def get("&colon;"), do: [58]
+  def get("&colone;"), do: [8788]
+  def get("&coloneq;"), do: [8788]
+  def get("&comma;"), do: [44]
+  def get("&commat;"), do: [64]
+  def get("&comp;"), do: [8705]
+  def get("&compfn;"), do: [8728]
+  def get("&complement;"), do: [8705]
+  def get("&complexes;"), do: [8450]
+  def get("&cong;"), do: [8773]
+  def get("&congdot;"), do: [10861]
+  def get("&conint;"), do: [8750]
+  def get("&copf;"), do: [120_148]
+  def get("&coprod;"), do: [8720]
+  def get("&copy"), do: [169]
+  def get("&copy;"), do: [169]
+  def get("&copysr;"), do: [8471]
+  def get("&crarr;"), do: [8629]
+  def get("&cross;"), do: [10007]
+  def get("&cscr;"), do: [119_992]
+  def get("&csub;"), do: [10959]
+  def get("&csube;"), do: [10961]
+  def get("&csup;"), do: [10960]
+  def get("&csupe;"), do: [10962]
+  def get("&ctdot;"), do: [8943]
+  def get("&cudarrl;"), do: [10552]
+  def get("&cudarrr;"), do: [10549]
+  def get("&cuepr;"), do: [8926]
+  def get("&cuesc;"), do: [8927]
+  def get("&cularr;"), do: [8630]
+  def get("&cularrp;"), do: [10557]
+  def get("&cup;"), do: [8746]
+  def get("&cupbrcap;"), do: [10824]
+  def get("&cupcap;"), do: [10822]
+  def get("&cupcup;"), do: [10826]
+  def get("&cupdot;"), do: [8845]
+  def get("&cupor;"), do: [10821]
+  def get("&cups;"), do: [8746, 65024]
+  def get("&curarr;"), do: [8631]
+  def get("&curarrm;"), do: [10556]
+  def get("&curlyeqprec;"), do: [8926]
+  def get("&curlyeqsucc;"), do: [8927]
+  def get("&curlyvee;"), do: [8910]
+  def get("&curlywedge;"), do: [8911]
+  def get("&curren"), do: [164]
+  def get("&curren;"), do: [164]
+  def get("&curvearrowleft;"), do: [8630]
+  def get("&curvearrowright;"), do: [8631]
+  def get("&cuvee;"), do: [8910]
+  def get("&cuwed;"), do: [8911]
+  def get("&cwconint;"), do: [8754]
+  def get("&cwint;"), do: [8753]
+  def get("&cylcty;"), do: [9005]
+  def get("&dArr;"), do: [8659]
+  def get("&dHar;"), do: [10597]
+  def get("&dagger;"), do: [8224]
+  def get("&daleth;"), do: [8504]
+  def get("&darr;"), do: [8595]
+  def get("&dash;"), do: [8208]
+  def get("&dashv;"), do: [8867]
+  def get("&dbkarow;"), do: [10511]
+  def get("&dblac;"), do: [733]
+  def get("&dcaron;"), do: [271]
+  def get("&dcy;"), do: [1076]
+  def get("&dd;"), do: [8518]
+  def get("&ddagger;"), do: [8225]
+  def get("&ddarr;"), do: [8650]
+  def get("&ddotseq;"), do: [10871]
+  def get("&deg"), do: [176]
+  def get("&deg;"), do: [176]
+  def get("&delta;"), do: [948]
+  def get("&demptyv;"), do: [10673]
+  def get("&dfisht;"), do: [10623]
+  def get("&dfr;"), do: [120_097]
+  def get("&dharl;"), do: [8643]
+  def get("&dharr;"), do: [8642]
+  def get("&diam;"), do: [8900]
+  def get("&diamond;"), do: [8900]
+  def get("&diamondsuit;"), do: [9830]
+  def get("&diams;"), do: [9830]
+  def get("&die;"), do: [168]
+  def get("&digamma;"), do: [989]
+  def get("&disin;"), do: [8946]
+  def get("&div;"), do: [247]
+  def get("&divide"), do: [247]
+  def get("&divide;"), do: [247]
+  def get("&divideontimes;"), do: [8903]
+  def get("&divonx;"), do: [8903]
+  def get("&djcy;"), do: [1106]
+  def get("&dlcorn;"), do: [8990]
+  def get("&dlcrop;"), do: [8973]
+  def get("&dollar;"), do: [36]
+  def get("&dopf;"), do: [120_149]
+  def get("&dot;"), do: [729]
+  def get("&doteq;"), do: [8784]
+  def get("&doteqdot;"), do: [8785]
+  def get("&dotminus;"), do: [8760]
+  def get("&dotplus;"), do: [8724]
+  def get("&dotsquare;"), do: [8865]
+  def get("&doublebarwedge;"), do: [8966]
+  def get("&downarrow;"), do: [8595]
+  def get("&downdownarrows;"), do: [8650]
+  def get("&downharpoonleft;"), do: [8643]
+  def get("&downharpoonright;"), do: [8642]
+  def get("&drbkarow;"), do: [10512]
+  def get("&drcorn;"), do: [8991]
+  def get("&drcrop;"), do: [8972]
+  def get("&dscr;"), do: [119_993]
+  def get("&dscy;"), do: [1109]
+  def get("&dsol;"), do: [10742]
+  def get("&dstrok;"), do: [273]
+  def get("&dtdot;"), do: [8945]
+  def get("&dtri;"), do: [9663]
+  def get("&dtrif;"), do: [9662]
+  def get("&duarr;"), do: [8693]
+  def get("&duhar;"), do: [10607]
+  def get("&dwangle;"), do: [10662]
+  def get("&dzcy;"), do: [1119]
+  def get("&dzigrarr;"), do: [10239]
+  def get("&eDDot;"), do: [10871]
+  def get("&eDot;"), do: [8785]
+  def get("&eacute"), do: [233]
+  def get("&eacute;"), do: [233]
+  def get("&easter;"), do: [10862]
+  def get("&ecaron;"), do: [283]
+  def get("&ecir;"), do: [8790]
+  def get("&ecirc"), do: [234]
+  def get("&ecirc;"), do: [234]
+  def get("&ecolon;"), do: [8789]
+  def get("&ecy;"), do: [1101]
+  def get("&edot;"), do: [279]
+  def get("&ee;"), do: [8519]
+  def get("&efDot;"), do: [8786]
+  def get("&efr;"), do: [120_098]
+  def get("&eg;"), do: [10906]
+  def get("&egrave"), do: [232]
+  def get("&egrave;"), do: [232]
+  def get("&egs;"), do: [10902]
+  def get("&egsdot;"), do: [10904]
+  def get("&el;"), do: [10905]
+  def get("&elinters;"), do: [9191]
+  def get("&ell;"), do: [8467]
+  def get("&els;"), do: [10901]
+  def get("&elsdot;"), do: [10903]
+  def get("&emacr;"), do: [275]
+  def get("&empty;"), do: [8709]
+  def get("&emptyset;"), do: [8709]
+  def get("&emptyv;"), do: [8709]
+  def get("&emsp13;"), do: [8196]
+  def get("&emsp14;"), do: [8197]
+  def get("&emsp;"), do: [8195]
+  def get("&eng;"), do: [331]
+  def get("&ensp;"), do: [8194]
+  def get("&eogon;"), do: [281]
+  def get("&eopf;"), do: [120_150]
+  def get("&epar;"), do: [8917]
+  def get("&eparsl;"), do: [10723]
+  def get("&eplus;"), do: [10865]
+  def get("&epsi;"), do: [949]
+  def get("&epsilon;"), do: [949]
+  def get("&epsiv;"), do: [1013]
+  def get("&eqcirc;"), do: [8790]
+  def get("&eqcolon;"), do: [8789]
+  def get("&eqsim;"), do: [8770]
+  def get("&eqslantgtr;"), do: [10902]
+  def get("&eqslantless;"), do: [10901]
+  def get("&equals;"), do: [61]
+  def get("&equest;"), do: [8799]
+  def get("&equiv;"), do: [8801]
+  def get("&equivDD;"), do: [10872]
+  def get("&eqvparsl;"), do: [10725]
+  def get("&erDot;"), do: [8787]
+  def get("&erarr;"), do: [10609]
+  def get("&escr;"), do: [8495]
+  def get("&esdot;"), do: [8784]
+  def get("&esim;"), do: [8770]
+  def get("&eta;"), do: [951]
+  def get("&eth"), do: [240]
+  def get("&eth;"), do: [240]
+  def get("&euml"), do: [235]
+  def get("&euml;"), do: [235]
+  def get("&euro;"), do: [8364]
+  def get("&excl;"), do: [33]
+  def get("&exist;"), do: [8707]
+  def get("&expectation;"), do: [8496]
+  def get("&exponentiale;"), do: [8519]
+  def get("&fallingdotseq;"), do: [8786]
+  def get("&fcy;"), do: [1092]
+  def get("&female;"), do: [9792]
+  def get("&ffilig;"), do: [64259]
+  def get("&fflig;"), do: [64256]
+  def get("&ffllig;"), do: [64260]
+  def get("&ffr;"), do: [120_099]
+  def get("&filig;"), do: [64257]
+  def get("&fjlig;"), do: [102, 106]
+  def get("&flat;"), do: [9837]
+  def get("&fllig;"), do: [64258]
+  def get("&fltns;"), do: [9649]
+  def get("&fnof;"), do: [402]
+  def get("&fopf;"), do: [120_151]
+  def get("&forall;"), do: [8704]
+  def get("&fork;"), do: [8916]
+  def get("&forkv;"), do: [10969]
+  def get("&fpartint;"), do: [10765]
+  def get("&frac12"), do: [189]
+  def get("&frac12;"), do: [189]
+  def get("&frac13;"), do: [8531]
+  def get("&frac14"), do: [188]
+  def get("&frac14;"), do: [188]
+  def get("&frac15;"), do: [8533]
+  def get("&frac16;"), do: [8537]
+  def get("&frac18;"), do: [8539]
+  def get("&frac23;"), do: [8532]
+  def get("&frac25;"), do: [8534]
+  def get("&frac34"), do: [190]
+  def get("&frac34;"), do: [190]
+  def get("&frac35;"), do: [8535]
+  def get("&frac38;"), do: [8540]
+  def get("&frac45;"), do: [8536]
+  def get("&frac56;"), do: [8538]
+  def get("&frac58;"), do: [8541]
+  def get("&frac78;"), do: [8542]
+  def get("&frasl;"), do: [8260]
+  def get("&frown;"), do: [8994]
+  def get("&fscr;"), do: [119_995]
+  def get("&gE;"), do: [8807]
+  def get("&gEl;"), do: [10892]
+  def get("&gacute;"), do: [501]
+  def get("&gamma;"), do: [947]
+  def get("&gammad;"), do: [989]
+  def get("&gap;"), do: [10886]
+  def get("&gbreve;"), do: [287]
+  def get("&gcirc;"), do: [285]
+  def get("&gcy;"), do: [1075]
+  def get("&gdot;"), do: [289]
+  def get("&ge;"), do: [8805]
+  def get("&gel;"), do: [8923]
+  def get("&geq;"), do: [8805]
+  def get("&geqq;"), do: [8807]
+  def get("&geqslant;"), do: [10878]
+  def get("&ges;"), do: [10878]
+  def get("&gescc;"), do: [10921]
+  def get("&gesdot;"), do: [10880]
+  def get("&gesdoto;"), do: [10882]
+  def get("&gesdotol;"), do: [10884]
+  def get("&gesl;"), do: [8923, 65024]
+  def get("&gesles;"), do: [10900]
+  def get("&gfr;"), do: [120_100]
+  def get("&gg;"), do: [8811]
+  def get("&ggg;"), do: [8921]
+  def get("&gimel;"), do: [8503]
+  def get("&gjcy;"), do: [1107]
+  def get("&gl;"), do: [8823]
+  def get("&glE;"), do: [10898]
+  def get("&gla;"), do: [10917]
+  def get("&glj;"), do: [10916]
+  def get("&gnE;"), do: [8809]
+  def get("&gnap;"), do: [10890]
+  def get("&gnapprox;"), do: [10890]
+  def get("&gne;"), do: [10888]
+  def get("&gneq;"), do: [10888]
+  def get("&gneqq;"), do: [8809]
+  def get("&gnsim;"), do: [8935]
+  def get("&gopf;"), do: [120_152]
+  def get("&grave;"), do: [96]
+  def get("&gscr;"), do: [8458]
+  def get("&gsim;"), do: [8819]
+  def get("&gsime;"), do: [10894]
+  def get("&gsiml;"), do: [10896]
+  def get("&gt"), do: [62]
+  def get("&gt;"), do: [62]
+  def get("&gtcc;"), do: [10919]
+  def get("&gtcir;"), do: [10874]
+  def get("&gtdot;"), do: [8919]
+  def get("&gtlPar;"), do: [10645]
+  def get("&gtquest;"), do: [10876]
+  def get("&gtrapprox;"), do: [10886]
+  def get("&gtrarr;"), do: [10616]
+  def get("&gtrdot;"), do: [8919]
+  def get("&gtreqless;"), do: [8923]
+  def get("&gtreqqless;"), do: [10892]
+  def get("&gtrless;"), do: [8823]
+  def get("&gtrsim;"), do: [8819]
+  def get("&gvertneqq;"), do: [8809, 65024]
+  def get("&gvnE;"), do: [8809, 65024]
+  def get("&hArr;"), do: [8660]
+  def get("&hairsp;"), do: [8202]
+  def get("&half;"), do: [189]
+  def get("&hamilt;"), do: [8459]
+  def get("&hardcy;"), do: [1098]
+  def get("&harr;"), do: [8596]
+  def get("&harrcir;"), do: [10568]
+  def get("&harrw;"), do: [8621]
+  def get("&hbar;"), do: [8463]
+  def get("&hcirc;"), do: [293]
+  def get("&hearts;"), do: [9829]
+  def get("&heartsuit;"), do: [9829]
+  def get("&hellip;"), do: [8230]
+  def get("&hercon;"), do: [8889]
+  def get("&hfr;"), do: [120_101]
+  def get("&hksearow;"), do: [10533]
+  def get("&hkswarow;"), do: [10534]
+  def get("&hoarr;"), do: [8703]
+  def get("&homtht;"), do: [8763]
+  def get("&hookleftarrow;"), do: [8617]
+  def get("&hookrightarrow;"), do: [8618]
+  def get("&hopf;"), do: [120_153]
+  def get("&horbar;"), do: [8213]
+  def get("&hscr;"), do: [119_997]
+  def get("&hslash;"), do: [8463]
+  def get("&hstrok;"), do: [295]
+  def get("&hybull;"), do: [8259]
+  def get("&hyphen;"), do: [8208]
+  def get("&iacute"), do: [237]
+  def get("&iacute;"), do: [237]
+  def get("&ic;"), do: [8291]
+  def get("&icirc"), do: [238]
+  def get("&icirc;"), do: [238]
+  def get("&icy;"), do: [1080]
+  def get("&iecy;"), do: [1077]
+  def get("&iexcl"), do: [161]
+  def get("&iexcl;"), do: [161]
+  def get("&iff;"), do: [8660]
+  def get("&ifr;"), do: [120_102]
+  def get("&igrave"), do: [236]
+  def get("&igrave;"), do: [236]
+  def get("&ii;"), do: [8520]
+  def get("&iiiint;"), do: [10764]
+  def get("&iiint;"), do: [8749]
+  def get("&iinfin;"), do: [10716]
+  def get("&iiota;"), do: [8489]
+  def get("&ijlig;"), do: [307]
+  def get("&imacr;"), do: [299]
+  def get("&image;"), do: [8465]
+  def get("&imagline;"), do: [8464]
+  def get("&imagpart;"), do: [8465]
+  def get("&imath;"), do: [305]
+  def get("&imof;"), do: [8887]
+  def get("&imped;"), do: [437]
+  def get("&in;"), do: [8712]
+  def get("&incare;"), do: [8453]
+  def get("&infin;"), do: [8734]
+  def get("&infintie;"), do: [10717]
+  def get("&inodot;"), do: [305]
+  def get("&int;"), do: [8747]
+  def get("&intcal;"), do: [8890]
+  def get("&integers;"), do: [8484]
+  def get("&intercal;"), do: [8890]
+  def get("&intlarhk;"), do: [10775]
+  def get("&intprod;"), do: [10812]
+  def get("&iocy;"), do: [1105]
+  def get("&iogon;"), do: [303]
+  def get("&iopf;"), do: [120_154]
+  def get("&iota;"), do: [953]
+  def get("&iprod;"), do: [10812]
+  def get("&iquest"), do: [191]
+  def get("&iquest;"), do: [191]
+  def get("&iscr;"), do: [119_998]
+  def get("&isin;"), do: [8712]
+  def get("&isinE;"), do: [8953]
+  def get("&isindot;"), do: [8949]
+  def get("&isins;"), do: [8948]
+  def get("&isinsv;"), do: [8947]
+  def get("&isinv;"), do: [8712]
+  def get("&it;"), do: [8290]
+  def get("&itilde;"), do: [297]
+  def get("&iukcy;"), do: [1110]
+  def get("&iuml"), do: [239]
+  def get("&iuml;"), do: [239]
+  def get("&jcirc;"), do: [309]
+  def get("&jcy;"), do: [1081]
+  def get("&jfr;"), do: [120_103]
+  def get("&jmath;"), do: [567]
+  def get("&jopf;"), do: [120_155]
+  def get("&jscr;"), do: [119_999]
+  def get("&jsercy;"), do: [1112]
+  def get("&jukcy;"), do: [1108]
+  def get("&kappa;"), do: [954]
+  def get("&kappav;"), do: [1008]
+  def get("&kcedil;"), do: [311]
+  def get("&kcy;"), do: [1082]
+  def get("&kfr;"), do: [120_104]
+  def get("&kgreen;"), do: [312]
+  def get("&khcy;"), do: [1093]
+  def get("&kjcy;"), do: [1116]
+  def get("&kopf;"), do: [120_156]
+  def get("&kscr;"), do: [120_000]
+  def get("&lAarr;"), do: [8666]
+  def get("&lArr;"), do: [8656]
+  def get("&lAtail;"), do: [10523]
+  def get("&lBarr;"), do: [10510]
+  def get("&lE;"), do: [8806]
+  def get("&lEg;"), do: [10891]
+  def get("&lHar;"), do: [10594]
+  def get("&lacute;"), do: [314]
+  def get("&laemptyv;"), do: [10676]
+  def get("&lagran;"), do: [8466]
+  def get("&lambda;"), do: [955]
+  def get("&lang;"), do: [10216]
+  def get("&langd;"), do: [10641]
+  def get("&langle;"), do: [10216]
+  def get("&lap;"), do: [10885]
+  def get("&laquo"), do: [171]
+  def get("&laquo;"), do: [171]
+  def get("&larr;"), do: [8592]
+  def get("&larrb;"), do: [8676]
+  def get("&larrbfs;"), do: [10527]
+  def get("&larrfs;"), do: [10525]
+  def get("&larrhk;"), do: [8617]
+  def get("&larrlp;"), do: [8619]
+  def get("&larrpl;"), do: [10553]
+  def get("&larrsim;"), do: [10611]
+  def get("&larrtl;"), do: [8610]
+  def get("&lat;"), do: [10923]
+  def get("&latail;"), do: [10521]
+  def get("&late;"), do: [10925]
+  def get("&lates;"), do: [10925, 65024]
+  def get("&lbarr;"), do: [10508]
+  def get("&lbbrk;"), do: [10098]
+  def get("&lbrace;"), do: [123]
+  def get("&lbrack;"), do: [91]
+  def get("&lbrke;"), do: [10635]
+  def get("&lbrksld;"), do: [10639]
+  def get("&lbrkslu;"), do: [10637]
+  def get("&lcaron;"), do: [318]
+  def get("&lcedil;"), do: [316]
+  def get("&lceil;"), do: [8968]
+  def get("&lcub;"), do: [123]
+  def get("&lcy;"), do: [1083]
+  def get("&ldca;"), do: [10550]
+  def get("&ldquo;"), do: [8220]
+  def get("&ldquor;"), do: [8222]
+  def get("&ldrdhar;"), do: [10599]
+  def get("&ldrushar;"), do: [10571]
+  def get("&ldsh;"), do: [8626]
+  def get("&le;"), do: [8804]
+  def get("&leftarrow;"), do: [8592]
+  def get("&leftarrowtail;"), do: [8610]
+  def get("&leftharpoondown;"), do: [8637]
+  def get("&leftharpoonup;"), do: [8636]
+  def get("&leftleftarrows;"), do: [8647]
+  def get("&leftrightarrow;"), do: [8596]
+  def get("&leftrightarrows;"), do: [8646]
+  def get("&leftrightharpoons;"), do: [8651]
+  def get("&leftrightsquigarrow;"), do: [8621]
+  def get("&leftthreetimes;"), do: [8907]
+  def get("&leg;"), do: [8922]
+  def get("&leq;"), do: [8804]
+  def get("&leqq;"), do: [8806]
+  def get("&leqslant;"), do: [10877]
+  def get("&les;"), do: [10877]
+  def get("&lescc;"), do: [10920]
+  def get("&lesdot;"), do: [10879]
+  def get("&lesdoto;"), do: [10881]
+  def get("&lesdotor;"), do: [10883]
+  def get("&lesg;"), do: [8922, 65024]
+  def get("&lesges;"), do: [10899]
+  def get("&lessapprox;"), do: [10885]
+  def get("&lessdot;"), do: [8918]
+  def get("&lesseqgtr;"), do: [8922]
+  def get("&lesseqqgtr;"), do: [10891]
+  def get("&lessgtr;"), do: [8822]
+  def get("&lesssim;"), do: [8818]
+  def get("&lfisht;"), do: [10620]
+  def get("&lfloor;"), do: [8970]
+  def get("&lfr;"), do: [120_105]
+  def get("&lg;"), do: [8822]
+  def get("&lgE;"), do: [10897]
+  def get("&lhard;"), do: [8637]
+  def get("&lharu;"), do: [8636]
+  def get("&lharul;"), do: [10602]
+  def get("&lhblk;"), do: [9604]
+  def get("&ljcy;"), do: [1113]
+  def get("&ll;"), do: [8810]
+  def get("&llarr;"), do: [8647]
+  def get("&llcorner;"), do: [8990]
+  def get("&llhard;"), do: [10603]
+  def get("&lltri;"), do: [9722]
+  def get("&lmidot;"), do: [320]
+  def get("&lmoust;"), do: [9136]
+  def get("&lmoustache;"), do: [9136]
+  def get("&lnE;"), do: [8808]
+  def get("&lnap;"), do: [10889]
+  def get("&lnapprox;"), do: [10889]
+  def get("&lne;"), do: [10887]
+  def get("&lneq;"), do: [10887]
+  def get("&lneqq;"), do: [8808]
+  def get("&lnsim;"), do: [8934]
+  def get("&loang;"), do: [10220]
+  def get("&loarr;"), do: [8701]
+  def get("&lobrk;"), do: [10214]
+  def get("&longleftarrow;"), do: [10229]
+  def get("&longleftrightarrow;"), do: [10231]
+  def get("&longmapsto;"), do: [10236]
+  def get("&longrightarrow;"), do: [10230]
+  def get("&looparrowleft;"), do: [8619]
+  def get("&looparrowright;"), do: [8620]
+  def get("&lopar;"), do: [10629]
+  def get("&lopf;"), do: [120_157]
+  def get("&loplus;"), do: [10797]
+  def get("&lotimes;"), do: [10804]
+  def get("&lowast;"), do: [8727]
+  def get("&lowbar;"), do: [95]
+  def get("&loz;"), do: [9674]
+  def get("&lozenge;"), do: [9674]
+  def get("&lozf;"), do: [10731]
+  def get("&lpar;"), do: [40]
+  def get("&lparlt;"), do: [10643]
+  def get("&lrarr;"), do: [8646]
+  def get("&lrcorner;"), do: [8991]
+  def get("&lrhar;"), do: [8651]
+  def get("&lrhard;"), do: [10605]
+  def get("&lrm;"), do: [8206]
+  def get("&lrtri;"), do: [8895]
+  def get("&lsaquo;"), do: [8249]
+  def get("&lscr;"), do: [120_001]
+  def get("&lsh;"), do: [8624]
+  def get("&lsim;"), do: [8818]
+  def get("&lsime;"), do: [10893]
+  def get("&lsimg;"), do: [10895]
+  def get("&lsqb;"), do: [91]
+  def get("&lsquo;"), do: [8216]
+  def get("&lsquor;"), do: [8218]
+  def get("&lstrok;"), do: [322]
+  def get("&lt"), do: [60]
+  def get("&lt;"), do: [60]
+  def get("&ltcc;"), do: [10918]
+  def get("&ltcir;"), do: [10873]
+  def get("&ltdot;"), do: [8918]
+  def get("&lthree;"), do: [8907]
+  def get("&ltimes;"), do: [8905]
+  def get("&ltlarr;"), do: [10614]
+  def get("&ltquest;"), do: [10875]
+  def get("&ltrPar;"), do: [10646]
+  def get("&ltri;"), do: [9667]
+  def get("&ltrie;"), do: [8884]
+  def get("&ltrif;"), do: [9666]
+  def get("&lurdshar;"), do: [10570]
+  def get("&luruhar;"), do: [10598]
+  def get("&lvertneqq;"), do: [8808, 65024]
+  def get("&lvnE;"), do: [8808, 65024]
+  def get("&mDDot;"), do: [8762]
+  def get("&macr"), do: [175]
+  def get("&macr;"), do: [175]
+  def get("&male;"), do: [9794]
+  def get("&malt;"), do: [10016]
+  def get("&maltese;"), do: [10016]
+  def get("&map;"), do: [8614]
+  def get("&mapsto;"), do: [8614]
+  def get("&mapstodown;"), do: [8615]
+  def get("&mapstoleft;"), do: [8612]
+  def get("&mapstoup;"), do: [8613]
+  def get("&marker;"), do: [9646]
+  def get("&mcomma;"), do: [10793]
+  def get("&mcy;"), do: [1084]
+  def get("&mdash;"), do: [8212]
+  def get("&measuredangle;"), do: [8737]
+  def get("&mfr;"), do: [120_106]
+  def get("&mho;"), do: [8487]
+  def get("&micro"), do: [181]
+  def get("&micro;"), do: [181]
+  def get("&mid;"), do: [8739]
+  def get("&midast;"), do: [42]
+  def get("&midcir;"), do: [10992]
+  def get("&middot"), do: [183]
+  def get("&middot;"), do: [183]
+  def get("&minus;"), do: [8722]
+  def get("&minusb;"), do: [8863]
+  def get("&minusd;"), do: [8760]
+  def get("&minusdu;"), do: [10794]
+  def get("&mlcp;"), do: [10971]
+  def get("&mldr;"), do: [8230]
+  def get("&mnplus;"), do: [8723]
+  def get("&models;"), do: [8871]
+  def get("&mopf;"), do: [120_158]
+  def get("&mp;"), do: [8723]
+  def get("&mscr;"), do: [120_002]
+  def get("&mstpos;"), do: [8766]
+  def get("&mu;"), do: [956]
+  def get("&multimap;"), do: [8888]
+  def get("&mumap;"), do: [8888]
+  def get("&nGg;"), do: [8921, 824]
+  def get("&nGt;"), do: [8811, 8402]
+  def get("&nGtv;"), do: [8811, 824]
+  def get("&nLeftarrow;"), do: [8653]
+  def get("&nLeftrightarrow;"), do: [8654]
+  def get("&nLl;"), do: [8920, 824]
+  def get("&nLt;"), do: [8810, 8402]
+  def get("&nLtv;"), do: [8810, 824]
+  def get("&nRightarrow;"), do: [8655]
+  def get("&nVDash;"), do: [8879]
+  def get("&nVdash;"), do: [8878]
+  def get("&nabla;"), do: [8711]
+  def get("&nacute;"), do: [324]
+  def get("&nang;"), do: [8736, 8402]
+  def get("&nap;"), do: [8777]
+  def get("&napE;"), do: [10864, 824]
+  def get("&napid;"), do: [8779, 824]
+  def get("&napos;"), do: [329]
+  def get("&napprox;"), do: [8777]
+  def get("&natur;"), do: [9838]
+  def get("&natural;"), do: [9838]
+  def get("&naturals;"), do: [8469]
+  def get("&nbsp"), do: [160]
+  def get("&nbsp;"), do: [160]
+  def get("&nbump;"), do: [8782, 824]
+  def get("&nbumpe;"), do: [8783, 824]
+  def get("&ncap;"), do: [10819]
+  def get("&ncaron;"), do: [328]
+  def get("&ncedil;"), do: [326]
+  def get("&ncong;"), do: [8775]
+  def get("&ncongdot;"), do: [10861, 824]
+  def get("&ncup;"), do: [10818]
+  def get("&ncy;"), do: [1085]
+  def get("&ndash;"), do: [8211]
+  def get("&ne;"), do: [8800]
+  def get("&neArr;"), do: [8663]
+  def get("&nearhk;"), do: [10532]
+  def get("&nearr;"), do: [8599]
+  def get("&nearrow;"), do: [8599]
+  def get("&nedot;"), do: [8784, 824]
+  def get("&nequiv;"), do: [8802]
+  def get("&nesear;"), do: [10536]
+  def get("&nesim;"), do: [8770, 824]
+  def get("&nexist;"), do: [8708]
+  def get("&nexists;"), do: [8708]
+  def get("&nfr;"), do: [120_107]
+  def get("&ngE;"), do: [8807, 824]
+  def get("&nge;"), do: [8817]
+  def get("&ngeq;"), do: [8817]
+  def get("&ngeqq;"), do: [8807, 824]
+  def get("&ngeqslant;"), do: [10878, 824]
+  def get("&nges;"), do: [10878, 824]
+  def get("&ngsim;"), do: [8821]
+  def get("&ngt;"), do: [8815]
+  def get("&ngtr;"), do: [8815]
+  def get("&nhArr;"), do: [8654]
+  def get("&nharr;"), do: [8622]
+  def get("&nhpar;"), do: [10994]
+  def get("&ni;"), do: [8715]
+  def get("&nis;"), do: [8956]
+  def get("&nisd;"), do: [8954]
+  def get("&niv;"), do: [8715]
+  def get("&njcy;"), do: [1114]
+  def get("&nlArr;"), do: [8653]
+  def get("&nlE;"), do: [8806, 824]
+  def get("&nlarr;"), do: [8602]
+  def get("&nldr;"), do: [8229]
+  def get("&nle;"), do: [8816]
+  def get("&nleftarrow;"), do: [8602]
+  def get("&nleftrightarrow;"), do: [8622]
+  def get("&nleq;"), do: [8816]
+  def get("&nleqq;"), do: [8806, 824]
+  def get("&nleqslant;"), do: [10877, 824]
+  def get("&nles;"), do: [10877, 824]
+  def get("&nless;"), do: [8814]
+  def get("&nlsim;"), do: [8820]
+  def get("&nlt;"), do: [8814]
+  def get("&nltri;"), do: [8938]
+  def get("&nltrie;"), do: [8940]
+  def get("&nmid;"), do: [8740]
+  def get("&nopf;"), do: [120_159]
+  def get("&not"), do: [172]
+  def get("&not;"), do: [172]
+  def get("&notin;"), do: [8713]
+  def get("&notinE;"), do: [8953, 824]
+  def get("&notindot;"), do: [8949, 824]
+  def get("&notinva;"), do: [8713]
+  def get("&notinvb;"), do: [8951]
+  def get("&notinvc;"), do: [8950]
+  def get("&notni;"), do: [8716]
+  def get("&notniva;"), do: [8716]
+  def get("&notnivb;"), do: [8958]
+  def get("&notnivc;"), do: [8957]
+  def get("&npar;"), do: [8742]
+  def get("&nparallel;"), do: [8742]
+  def get("&nparsl;"), do: [11005, 8421]
+  def get("&npart;"), do: [8706, 824]
+  def get("&npolint;"), do: [10772]
+  def get("&npr;"), do: [8832]
+  def get("&nprcue;"), do: [8928]
+  def get("&npre;"), do: [10927, 824]
+  def get("&nprec;"), do: [8832]
+  def get("&npreceq;"), do: [10927, 824]
+  def get("&nrArr;"), do: [8655]
+  def get("&nrarr;"), do: [8603]
+  def get("&nrarrc;"), do: [10547, 824]
+  def get("&nrarrw;"), do: [8605, 824]
+  def get("&nrightarrow;"), do: [8603]
+  def get("&nrtri;"), do: [8939]
+  def get("&nrtrie;"), do: [8941]
+  def get("&nsc;"), do: [8833]
+  def get("&nsccue;"), do: [8929]
+  def get("&nsce;"), do: [10928, 824]
+  def get("&nscr;"), do: [120_003]
+  def get("&nshortmid;"), do: [8740]
+  def get("&nshortparallel;"), do: [8742]
+  def get("&nsim;"), do: [8769]
+  def get("&nsime;"), do: [8772]
+  def get("&nsimeq;"), do: [8772]
+  def get("&nsmid;"), do: [8740]
+  def get("&nspar;"), do: [8742]
+  def get("&nsqsube;"), do: [8930]
+  def get("&nsqsupe;"), do: [8931]
+  def get("&nsub;"), do: [8836]
+  def get("&nsubE;"), do: [10949, 824]
+  def get("&nsube;"), do: [8840]
+  def get("&nsubset;"), do: [8834, 8402]
+  def get("&nsubseteq;"), do: [8840]
+  def get("&nsubseteqq;"), do: [10949, 824]
+  def get("&nsucc;"), do: [8833]
+  def get("&nsucceq;"), do: [10928, 824]
+  def get("&nsup;"), do: [8837]
+  def get("&nsupE;"), do: [10950, 824]
+  def get("&nsupe;"), do: [8841]
+  def get("&nsupset;"), do: [8835, 8402]
+  def get("&nsupseteq;"), do: [8841]
+  def get("&nsupseteqq;"), do: [10950, 824]
+  def get("&ntgl;"), do: [8825]
+  def get("&ntilde"), do: [241]
+  def get("&ntilde;"), do: [241]
+  def get("&ntlg;"), do: [8824]
+  def get("&ntriangleleft;"), do: [8938]
+  def get("&ntrianglelefteq;"), do: [8940]
+  def get("&ntriangleright;"), do: [8939]
+  def get("&ntrianglerighteq;"), do: [8941]
+  def get("&nu;"), do: [957]
+  def get("&num;"), do: [35]
+  def get("&numero;"), do: [8470]
+  def get("&numsp;"), do: [8199]
+  def get("&nvDash;"), do: [8877]
+  def get("&nvHarr;"), do: [10500]
+  def get("&nvap;"), do: [8781, 8402]
+  def get("&nvdash;"), do: [8876]
+  def get("&nvge;"), do: [8805, 8402]
+  def get("&nvgt;"), do: [62, 8402]
+  def get("&nvinfin;"), do: [10718]
+  def get("&nvlArr;"), do: [10498]
+  def get("&nvle;"), do: [8804, 8402]
+  def get("&nvlt;"), do: [60, 8402]
+  def get("&nvltrie;"), do: [8884, 8402]
+  def get("&nvrArr;"), do: [10499]
+  def get("&nvrtrie;"), do: [8885, 8402]
+  def get("&nvsim;"), do: [8764, 8402]
+  def get("&nwArr;"), do: [8662]
+  def get("&nwarhk;"), do: [10531]
+  def get("&nwarr;"), do: [8598]
+  def get("&nwarrow;"), do: [8598]
+  def get("&nwnear;"), do: [10535]
+  def get("&oS;"), do: [9416]
+  def get("&oacute"), do: [243]
+  def get("&oacute;"), do: [243]
+  def get("&oast;"), do: [8859]
+  def get("&ocir;"), do: [8858]
+  def get("&ocirc"), do: [244]
+  def get("&ocirc;"), do: [244]
+  def get("&ocy;"), do: [1086]
+  def get("&odash;"), do: [8861]
+  def get("&odblac;"), do: [337]
+  def get("&odiv;"), do: [10808]
+  def get("&odot;"), do: [8857]
+  def get("&odsold;"), do: [10684]
+  def get("&oelig;"), do: [339]
+  def get("&ofcir;"), do: [10687]
+  def get("&ofr;"), do: [120_108]
+  def get("&ogon;"), do: [731]
+  def get("&ograve"), do: [242]
+  def get("&ograve;"), do: [242]
+  def get("&ogt;"), do: [10689]
+  def get("&ohbar;"), do: [10677]
+  def get("&ohm;"), do: [937]
+  def get("&oint;"), do: [8750]
+  def get("&olarr;"), do: [8634]
+  def get("&olcir;"), do: [10686]
+  def get("&olcross;"), do: [10683]
+  def get("&oline;"), do: [8254]
+  def get("&olt;"), do: [10688]
+  def get("&omacr;"), do: [333]
+  def get("&omega;"), do: [969]
+  def get("&omicron;"), do: [959]
+  def get("&omid;"), do: [10678]
+  def get("&ominus;"), do: [8854]
+  def get("&oopf;"), do: [120_160]
+  def get("&opar;"), do: [10679]
+  def get("&operp;"), do: [10681]
+  def get("&oplus;"), do: [8853]
+  def get("&or;"), do: [8744]
+  def get("&orarr;"), do: [8635]
+  def get("&ord;"), do: [10845]
+  def get("&order;"), do: [8500]
+  def get("&orderof;"), do: [8500]
+  def get("&ordf"), do: [170]
+  def get("&ordf;"), do: [170]
+  def get("&ordm"), do: [186]
+  def get("&ordm;"), do: [186]
+  def get("&origof;"), do: [8886]
+  def get("&oror;"), do: [10838]
+  def get("&orslope;"), do: [10839]
+  def get("&orv;"), do: [10843]
+  def get("&oscr;"), do: [8500]
+  def get("&oslash"), do: [248]
+  def get("&oslash;"), do: [248]
+  def get("&osol;"), do: [8856]
+  def get("&otilde"), do: [245]
+  def get("&otilde;"), do: [245]
+  def get("&otimes;"), do: [8855]
+  def get("&otimesas;"), do: [10806]
+  def get("&ouml"), do: [246]
+  def get("&ouml;"), do: [246]
+  def get("&ovbar;"), do: [9021]
+  def get("&par;"), do: [8741]
+  def get("&para"), do: [182]
+  def get("&para;"), do: [182]
+  def get("&parallel;"), do: [8741]
+  def get("&parsim;"), do: [10995]
+  def get("&parsl;"), do: [11005]
+  def get("&part;"), do: [8706]
+  def get("&pcy;"), do: [1087]
+  def get("&percnt;"), do: [37]
+  def get("&period;"), do: [46]
+  def get("&permil;"), do: [8240]
+  def get("&perp;"), do: [8869]
+  def get("&pertenk;"), do: [8241]
+  def get("&pfr;"), do: [120_109]
+  def get("&phi;"), do: [966]
+  def get("&phiv;"), do: [981]
+  def get("&phmmat;"), do: [8499]
+  def get("&phone;"), do: [9742]
+  def get("&pi;"), do: [960]
+  def get("&pitchfork;"), do: [8916]
+  def get("&piv;"), do: [982]
+  def get("&planck;"), do: [8463]
+  def get("&planckh;"), do: [8462]
+  def get("&plankv;"), do: [8463]
+  def get("&plus;"), do: [43]
+  def get("&plusacir;"), do: [10787]
+  def get("&plusb;"), do: [8862]
+  def get("&pluscir;"), do: [10786]
+  def get("&plusdo;"), do: [8724]
+  def get("&plusdu;"), do: [10789]
+  def get("&pluse;"), do: [10866]
+  def get("&plusmn"), do: [177]
+  def get("&plusmn;"), do: [177]
+  def get("&plussim;"), do: [10790]
+  def get("&plustwo;"), do: [10791]
+  def get("&pm;"), do: [177]
+  def get("&pointint;"), do: [10773]
+  def get("&popf;"), do: [120_161]
+  def get("&pound"), do: [163]
+  def get("&pound;"), do: [163]
+  def get("&pr;"), do: [8826]
+  def get("&prE;"), do: [10931]
+  def get("&prap;"), do: [10935]
+  def get("&prcue;"), do: [8828]
+  def get("&pre;"), do: [10927]
+  def get("&prec;"), do: [8826]
+  def get("&precapprox;"), do: [10935]
+  def get("&preccurlyeq;"), do: [8828]
+  def get("&preceq;"), do: [10927]
+  def get("&precnapprox;"), do: [10937]
+  def get("&precneqq;"), do: [10933]
+  def get("&precnsim;"), do: [8936]
+  def get("&precsim;"), do: [8830]
+  def get("&prime;"), do: [8242]
+  def get("&primes;"), do: [8473]
+  def get("&prnE;"), do: [10933]
+  def get("&prnap;"), do: [10937]
+  def get("&prnsim;"), do: [8936]
+  def get("&prod;"), do: [8719]
+  def get("&profalar;"), do: [9006]
+  def get("&profline;"), do: [8978]
+  def get("&profsurf;"), do: [8979]
+  def get("&prop;"), do: [8733]
+  def get("&propto;"), do: [8733]
+  def get("&prsim;"), do: [8830]
+  def get("&prurel;"), do: [8880]
+  def get("&pscr;"), do: [120_005]
+  def get("&psi;"), do: [968]
+  def get("&puncsp;"), do: [8200]
+  def get("&qfr;"), do: [120_110]
+  def get("&qint;"), do: [10764]
+  def get("&qopf;"), do: [120_162]
+  def get("&qprime;"), do: [8279]
+  def get("&qscr;"), do: [120_006]
+  def get("&quaternions;"), do: [8461]
+  def get("&quatint;"), do: [10774]
+  def get("&quest;"), do: [63]
+  def get("&questeq;"), do: [8799]
+  def get("&quot"), do: [34]
+  def get("&quot;"), do: [34]
+  def get("&rAarr;"), do: [8667]
+  def get("&rArr;"), do: [8658]
+  def get("&rAtail;"), do: [10524]
+  def get("&rBarr;"), do: [10511]
+  def get("&rHar;"), do: [10596]
+  def get("&race;"), do: [8765, 817]
+  def get("&racute;"), do: [341]
+  def get("&radic;"), do: [8730]
+  def get("&raemptyv;"), do: [10675]
+  def get("&rang;"), do: [10217]
+  def get("&rangd;"), do: [10642]
+  def get("&range;"), do: [10661]
+  def get("&rangle;"), do: [10217]
+  def get("&raquo"), do: [187]
+  def get("&raquo;"), do: [187]
+  def get("&rarr;"), do: [8594]
+  def get("&rarrap;"), do: [10613]
+  def get("&rarrb;"), do: [8677]
+  def get("&rarrbfs;"), do: [10528]
+  def get("&rarrc;"), do: [10547]
+  def get("&rarrfs;"), do: [10526]
+  def get("&rarrhk;"), do: [8618]
+  def get("&rarrlp;"), do: [8620]
+  def get("&rarrpl;"), do: [10565]
+  def get("&rarrsim;"), do: [10612]
+  def get("&rarrtl;"), do: [8611]
+  def get("&rarrw;"), do: [8605]
+  def get("&ratail;"), do: [10522]
+  def get("&ratio;"), do: [8758]
+  def get("&rationals;"), do: [8474]
+  def get("&rbarr;"), do: [10509]
+  def get("&rbbrk;"), do: [10099]
+  def get("&rbrace;"), do: [125]
+  def get("&rbrack;"), do: [93]
+  def get("&rbrke;"), do: [10636]
+  def get("&rbrksld;"), do: [10638]
+  def get("&rbrkslu;"), do: [10640]
+  def get("&rcaron;"), do: [345]
+  def get("&rcedil;"), do: [343]
+  def get("&rceil;"), do: [8969]
+  def get("&rcub;"), do: [125]
+  def get("&rcy;"), do: [1088]
+  def get("&rdca;"), do: [10551]
+  def get("&rdldhar;"), do: [10601]
+  def get("&rdquo;"), do: [8221]
+  def get("&rdquor;"), do: [8221]
+  def get("&rdsh;"), do: [8627]
+  def get("&real;"), do: [8476]
+  def get("&realine;"), do: [8475]
+  def get("&realpart;"), do: [8476]
+  def get("&reals;"), do: [8477]
+  def get("&rect;"), do: [9645]
+  def get("&reg"), do: [174]
+  def get("&reg;"), do: [174]
+  def get("&rfisht;"), do: [10621]
+  def get("&rfloor;"), do: [8971]
+  def get("&rfr;"), do: [120_111]
+  def get("&rhard;"), do: [8641]
+  def get("&rharu;"), do: [8640]
+  def get("&rharul;"), do: [10604]
+  def get("&rho;"), do: [961]
+  def get("&rhov;"), do: [1009]
+  def get("&rightarrow;"), do: [8594]
+  def get("&rightarrowtail;"), do: [8611]
+  def get("&rightharpoondown;"), do: [8641]
+  def get("&rightharpoonup;"), do: [8640]
+  def get("&rightleftarrows;"), do: [8644]
+  def get("&rightleftharpoons;"), do: [8652]
+  def get("&rightrightarrows;"), do: [8649]
+  def get("&rightsquigarrow;"), do: [8605]
+  def get("&rightthreetimes;"), do: [8908]
+  def get("&ring;"), do: [730]
+  def get("&risingdotseq;"), do: [8787]
+  def get("&rlarr;"), do: [8644]
+  def get("&rlhar;"), do: [8652]
+  def get("&rlm;"), do: [8207]
+  def get("&rmoust;"), do: [9137]
+  def get("&rmoustache;"), do: [9137]
+  def get("&rnmid;"), do: [10990]
+  def get("&roang;"), do: [10221]
+  def get("&roarr;"), do: [8702]
+  def get("&robrk;"), do: [10215]
+  def get("&ropar;"), do: [10630]
+  def get("&ropf;"), do: [120_163]
+  def get("&roplus;"), do: [10798]
+  def get("&rotimes;"), do: [10805]
+  def get("&rpar;"), do: [41]
+  def get("&rpargt;"), do: [10644]
+  def get("&rppolint;"), do: [10770]
+  def get("&rrarr;"), do: [8649]
+  def get("&rsaquo;"), do: [8250]
+  def get("&rscr;"), do: [120_007]
+  def get("&rsh;"), do: [8625]
+  def get("&rsqb;"), do: [93]
+  def get("&rsquo;"), do: [8217]
+  def get("&rsquor;"), do: [8217]
+  def get("&rthree;"), do: [8908]
+  def get("&rtimes;"), do: [8906]
+  def get("&rtri;"), do: [9657]
+  def get("&rtrie;"), do: [8885]
+  def get("&rtrif;"), do: [9656]
+  def get("&rtriltri;"), do: [10702]
+  def get("&ruluhar;"), do: [10600]
+  def get("&rx;"), do: [8478]
+  def get("&sacute;"), do: [347]
+  def get("&sbquo;"), do: [8218]
+  def get("&sc;"), do: [8827]
+  def get("&scE;"), do: [10932]
+  def get("&scap;"), do: [10936]
+  def get("&scaron;"), do: [353]
+  def get("&sccue;"), do: [8829]
+  def get("&sce;"), do: [10928]
+  def get("&scedil;"), do: [351]
+  def get("&scirc;"), do: [349]
+  def get("&scnE;"), do: [10934]
+  def get("&scnap;"), do: [10938]
+  def get("&scnsim;"), do: [8937]
+  def get("&scpolint;"), do: [10771]
+  def get("&scsim;"), do: [8831]
+  def get("&scy;"), do: [1089]
+  def get("&sdot;"), do: [8901]
+  def get("&sdotb;"), do: [8865]
+  def get("&sdote;"), do: [10854]
+  def get("&seArr;"), do: [8664]
+  def get("&searhk;"), do: [10533]
+  def get("&searr;"), do: [8600]
+  def get("&searrow;"), do: [8600]
+  def get("&sect"), do: [167]
+  def get("&sect;"), do: [167]
+  def get("&semi;"), do: [59]
+  def get("&seswar;"), do: [10537]
+  def get("&setminus;"), do: [8726]
+  def get("&setmn;"), do: [8726]
+  def get("&sext;"), do: [10038]
+  def get("&sfr;"), do: [120_112]
+  def get("&sfrown;"), do: [8994]
+  def get("&sharp;"), do: [9839]
+  def get("&shchcy;"), do: [1097]
+  def get("&shcy;"), do: [1096]
+  def get("&shortmid;"), do: [8739]
+  def get("&shortparallel;"), do: [8741]
+  def get("&shy"), do: [173]
+  def get("&shy;"), do: [173]
+  def get("&sigma;"), do: [963]
+  def get("&sigmaf;"), do: [962]
+  def get("&sigmav;"), do: [962]
+  def get("&sim;"), do: [8764]
+  def get("&simdot;"), do: [10858]
+  def get("&sime;"), do: [8771]
+  def get("&simeq;"), do: [8771]
+  def get("&simg;"), do: [10910]
+  def get("&simgE;"), do: [10912]
+  def get("&siml;"), do: [10909]
+  def get("&simlE;"), do: [10911]
+  def get("&simne;"), do: [8774]
+  def get("&simplus;"), do: [10788]
+  def get("&simrarr;"), do: [10610]
+  def get("&slarr;"), do: [8592]
+  def get("&smallsetminus;"), do: [8726]
+  def get("&smashp;"), do: [10803]
+  def get("&smeparsl;"), do: [10724]
+  def get("&smid;"), do: [8739]
+  def get("&smile;"), do: [8995]
+  def get("&smt;"), do: [10922]
+  def get("&smte;"), do: [10924]
+  def get("&smtes;"), do: [10924, 65024]
+  def get("&softcy;"), do: [1100]
+  def get("&sol;"), do: [47]
+  def get("&solb;"), do: [10692]
+  def get("&solbar;"), do: [9023]
+  def get("&sopf;"), do: [120_164]
+  def get("&spades;"), do: [9824]
+  def get("&spadesuit;"), do: [9824]
+  def get("&spar;"), do: [8741]
+  def get("&sqcap;"), do: [8851]
+  def get("&sqcaps;"), do: [8851, 65024]
+  def get("&sqcup;"), do: [8852]
+  def get("&sqcups;"), do: [8852, 65024]
+  def get("&sqsub;"), do: [8847]
+  def get("&sqsube;"), do: [8849]
+  def get("&sqsubset;"), do: [8847]
+  def get("&sqsubseteq;"), do: [8849]
+  def get("&sqsup;"), do: [8848]
+  def get("&sqsupe;"), do: [8850]
+  def get("&sqsupset;"), do: [8848]
+  def get("&sqsupseteq;"), do: [8850]
+  def get("&squ;"), do: [9633]
+  def get("&square;"), do: [9633]
+  def get("&squarf;"), do: [9642]
+  def get("&squf;"), do: [9642]
+  def get("&srarr;"), do: [8594]
+  def get("&sscr;"), do: [120_008]
+  def get("&ssetmn;"), do: [8726]
+  def get("&ssmile;"), do: [8995]
+  def get("&sstarf;"), do: [8902]
+  def get("&star;"), do: [9734]
+  def get("&starf;"), do: [9733]
+  def get("&straightepsilon;"), do: [1013]
+  def get("&straightphi;"), do: [981]
+  def get("&strns;"), do: [175]
+  def get("&sub;"), do: [8834]
+  def get("&subE;"), do: [10949]
+  def get("&subdot;"), do: [10941]
+  def get("&sube;"), do: [8838]
+  def get("&subedot;"), do: [10947]
+  def get("&submult;"), do: [10945]
+  def get("&subnE;"), do: [10955]
+  def get("&subne;"), do: [8842]
+  def get("&subplus;"), do: [10943]
+  def get("&subrarr;"), do: [10617]
+  def get("&subset;"), do: [8834]
+  def get("&subseteq;"), do: [8838]
+  def get("&subseteqq;"), do: [10949]
+  def get("&subsetneq;"), do: [8842]
+  def get("&subsetneqq;"), do: [10955]
+  def get("&subsim;"), do: [10951]
+  def get("&subsub;"), do: [10965]
+  def get("&subsup;"), do: [10963]
+  def get("&succ;"), do: [8827]
+  def get("&succapprox;"), do: [10936]
+  def get("&succcurlyeq;"), do: [8829]
+  def get("&succeq;"), do: [10928]
+  def get("&succnapprox;"), do: [10938]
+  def get("&succneqq;"), do: [10934]
+  def get("&succnsim;"), do: [8937]
+  def get("&succsim;"), do: [8831]
+  def get("&sum;"), do: [8721]
+  def get("&sung;"), do: [9834]
+  def get("&sup1"), do: [185]
+  def get("&sup1;"), do: [185]
+  def get("&sup2"), do: [178]
+  def get("&sup2;"), do: [178]
+  def get("&sup3"), do: [179]
+  def get("&sup3;"), do: [179]
+  def get("&sup;"), do: [8835]
+  def get("&supE;"), do: [10950]
+  def get("&supdot;"), do: [10942]
+  def get("&supdsub;"), do: [10968]
+  def get("&supe;"), do: [8839]
+  def get("&supedot;"), do: [10948]
+  def get("&suphsol;"), do: [10185]
+  def get("&suphsub;"), do: [10967]
+  def get("&suplarr;"), do: [10619]
+  def get("&supmult;"), do: [10946]
+  def get("&supnE;"), do: [10956]
+  def get("&supne;"), do: [8843]
+  def get("&supplus;"), do: [10944]
+  def get("&supset;"), do: [8835]
+  def get("&supseteq;"), do: [8839]
+  def get("&supseteqq;"), do: [10950]
+  def get("&supsetneq;"), do: [8843]
+  def get("&supsetneqq;"), do: [10956]
+  def get("&supsim;"), do: [10952]
+  def get("&supsub;"), do: [10964]
+  def get("&supsup;"), do: [10966]
+  def get("&swArr;"), do: [8665]
+  def get("&swarhk;"), do: [10534]
+  def get("&swarr;"), do: [8601]
+  def get("&swarrow;"), do: [8601]
+  def get("&swnwar;"), do: [10538]
+  def get("&szlig"), do: [223]
+  def get("&szlig;"), do: [223]
+  def get("&target;"), do: [8982]
+  def get("&tau;"), do: [964]
+  def get("&tbrk;"), do: [9140]
+  def get("&tcaron;"), do: [357]
+  def get("&tcedil;"), do: [355]
+  def get("&tcy;"), do: [1090]
+  def get("&tdot;"), do: [8411]
+  def get("&telrec;"), do: [8981]
+  def get("&tfr;"), do: [120_113]
+  def get("&there4;"), do: [8756]
+  def get("&therefore;"), do: [8756]
+  def get("&theta;"), do: [952]
+  def get("&thetasym;"), do: [977]
+  def get("&thetav;"), do: [977]
+  def get("&thickapprox;"), do: [8776]
+  def get("&thicksim;"), do: [8764]
+  def get("&thinsp;"), do: [8201]
+  def get("&thkap;"), do: [8776]
+  def get("&thksim;"), do: [8764]
+  def get("&thorn"), do: [254]
+  def get("&thorn;"), do: [254]
+  def get("&tilde;"), do: [732]
+  def get("&times"), do: [215]
+  def get("&times;"), do: [215]
+  def get("&timesb;"), do: [8864]
+  def get("&timesbar;"), do: [10801]
+  def get("&timesd;"), do: [10800]
+  def get("&tint;"), do: [8749]
+  def get("&toea;"), do: [10536]
+  def get("&top;"), do: [8868]
+  def get("&topbot;"), do: [9014]
+  def get("&topcir;"), do: [10993]
+  def get("&topf;"), do: [120_165]
+  def get("&topfork;"), do: [10970]
+  def get("&tosa;"), do: [10537]
+  def get("&tprime;"), do: [8244]
+  def get("&trade;"), do: [8482]
+  def get("&triangle;"), do: [9653]
+  def get("&triangledown;"), do: [9663]
+  def get("&triangleleft;"), do: [9667]
+  def get("&trianglelefteq;"), do: [8884]
+  def get("&triangleq;"), do: [8796]
+  def get("&triangleright;"), do: [9657]
+  def get("&trianglerighteq;"), do: [8885]
+  def get("&tridot;"), do: [9708]
+  def get("&trie;"), do: [8796]
+  def get("&triminus;"), do: [10810]
+  def get("&triplus;"), do: [10809]
+  def get("&trisb;"), do: [10701]
+  def get("&tritime;"), do: [10811]
+  def get("&trpezium;"), do: [9186]
+  def get("&tscr;"), do: [120_009]
+  def get("&tscy;"), do: [1094]
+  def get("&tshcy;"), do: [1115]
+  def get("&tstrok;"), do: [359]
+  def get("&twixt;"), do: [8812]
+  def get("&twoheadleftarrow;"), do: [8606]
+  def get("&twoheadrightarrow;"), do: [8608]
+  def get("&uArr;"), do: [8657]
+  def get("&uHar;"), do: [10595]
+  def get("&uacute"), do: [250]
+  def get("&uacute;"), do: [250]
+  def get("&uarr;"), do: [8593]
+  def get("&ubrcy;"), do: [1118]
+  def get("&ubreve;"), do: [365]
+  def get("&ucirc"), do: [251]
+  def get("&ucirc;"), do: [251]
+  def get("&ucy;"), do: [1091]
+  def get("&udarr;"), do: [8645]
+  def get("&udblac;"), do: [369]
+  def get("&udhar;"), do: [10606]
+  def get("&ufisht;"), do: [10622]
+  def get("&ufr;"), do: [120_114]
+  def get("&ugrave"), do: [249]
+  def get("&ugrave;"), do: [249]
+  def get("&uharl;"), do: [8639]
+  def get("&uharr;"), do: [8638]
+  def get("&uhblk;"), do: [9600]
+  def get("&ulcorn;"), do: [8988]
+  def get("&ulcorner;"), do: [8988]
+  def get("&ulcrop;"), do: [8975]
+  def get("&ultri;"), do: [9720]
+  def get("&umacr;"), do: [363]
+  def get("&uml"), do: [168]
+  def get("&uml;"), do: [168]
+  def get("&uogon;"), do: [371]
+  def get("&uopf;"), do: [120_166]
+  def get("&uparrow;"), do: [8593]
+  def get("&updownarrow;"), do: [8597]
+  def get("&upharpoonleft;"), do: [8639]
+  def get("&upharpoonright;"), do: [8638]
+  def get("&uplus;"), do: [8846]
+  def get("&upsi;"), do: [965]
+  def get("&upsih;"), do: [978]
+  def get("&upsilon;"), do: [965]
+  def get("&upuparrows;"), do: [8648]
+  def get("&urcorn;"), do: [8989]
+  def get("&urcorner;"), do: [8989]
+  def get("&urcrop;"), do: [8974]
+  def get("&uring;"), do: [367]
+  def get("&urtri;"), do: [9721]
+  def get("&uscr;"), do: [120_010]
+  def get("&utdot;"), do: [8944]
+  def get("&utilde;"), do: [361]
+  def get("&utri;"), do: [9653]
+  def get("&utrif;"), do: [9652]
+  def get("&uuarr;"), do: [8648]
+  def get("&uuml"), do: [252]
+  def get("&uuml;"), do: [252]
+  def get("&uwangle;"), do: [10663]
+  def get("&vArr;"), do: [8661]
+  def get("&vBar;"), do: [10984]
+  def get("&vBarv;"), do: [10985]
+  def get("&vDash;"), do: [8872]
+  def get("&vangrt;"), do: [10652]
+  def get("&varepsilon;"), do: [1013]
+  def get("&varkappa;"), do: [1008]
+  def get("&varnothing;"), do: [8709]
+  def get("&varphi;"), do: [981]
+  def get("&varpi;"), do: [982]
+  def get("&varpropto;"), do: [8733]
+  def get("&varr;"), do: [8597]
+  def get("&varrho;"), do: [1009]
+  def get("&varsigma;"), do: [962]
+  def get("&varsubsetneq;"), do: [8842, 65024]
+  def get("&varsubsetneqq;"), do: [10955, 65024]
+  def get("&varsupsetneq;"), do: [8843, 65024]
+  def get("&varsupsetneqq;"), do: [10956, 65024]
+  def get("&vartheta;"), do: [977]
+  def get("&vartriangleleft;"), do: [8882]
+  def get("&vartriangleright;"), do: [8883]
+  def get("&vcy;"), do: [1074]
+  def get("&vdash;"), do: [8866]
+  def get("&vee;"), do: [8744]
+  def get("&veebar;"), do: [8891]
+  def get("&veeeq;"), do: [8794]
+  def get("&vellip;"), do: [8942]
+  def get("&verbar;"), do: [124]
+  def get("&vert;"), do: [124]
+  def get("&vfr;"), do: [120_115]
+  def get("&vltri;"), do: [8882]
+  def get("&vnsub;"), do: [8834, 8402]
+  def get("&vnsup;"), do: [8835, 8402]
+  def get("&vopf;"), do: [120_167]
+  def get("&vprop;"), do: [8733]
+  def get("&vrtri;"), do: [8883]
+  def get("&vscr;"), do: [120_011]
+  def get("&vsubnE;"), do: [10955, 65024]
+  def get("&vsubne;"), do: [8842, 65024]
+  def get("&vsupnE;"), do: [10956, 65024]
+  def get("&vsupne;"), do: [8843, 65024]
+  def get("&vzigzag;"), do: [10650]
+  def get("&wcirc;"), do: [373]
+  def get("&wedbar;"), do: [10847]
+  def get("&wedge;"), do: [8743]
+  def get("&wedgeq;"), do: [8793]
+  def get("&weierp;"), do: [8472]
+  def get("&wfr;"), do: [120_116]
+  def get("&wopf;"), do: [120_168]
+  def get("&wp;"), do: [8472]
+  def get("&wr;"), do: [8768]
+  def get("&wreath;"), do: [8768]
+  def get("&wscr;"), do: [120_012]
+  def get("&xcap;"), do: [8898]
+  def get("&xcirc;"), do: [9711]
+  def get("&xcup;"), do: [8899]
+  def get("&xdtri;"), do: [9661]
+  def get("&xfr;"), do: [120_117]
+  def get("&xhArr;"), do: [10234]
+  def get("&xharr;"), do: [10231]
+  def get("&xi;"), do: [958]
+  def get("&xlArr;"), do: [10232]
+  def get("&xlarr;"), do: [10229]
+  def get("&xmap;"), do: [10236]
+  def get("&xnis;"), do: [8955]
+  def get("&xodot;"), do: [10752]
+  def get("&xopf;"), do: [120_169]
+  def get("&xoplus;"), do: [10753]
+  def get("&xotime;"), do: [10754]
+  def get("&xrArr;"), do: [10233]
+  def get("&xrarr;"), do: [10230]
+  def get("&xscr;"), do: [120_013]
+  def get("&xsqcup;"), do: [10758]
+  def get("&xuplus;"), do: [10756]
+  def get("&xutri;"), do: [9651]
+  def get("&xvee;"), do: [8897]
+  def get("&xwedge;"), do: [8896]
+  def get("&yacute"), do: [253]
+  def get("&yacute;"), do: [253]
+  def get("&yacy;"), do: [1103]
+  def get("&ycirc;"), do: [375]
+  def get("&ycy;"), do: [1099]
+  def get("&yen"), do: [165]
+  def get("&yen;"), do: [165]
+  def get("&yfr;"), do: [120_118]
+  def get("&yicy;"), do: [1111]
+  def get("&yopf;"), do: [120_170]
+  def get("&yscr;"), do: [120_014]
+  def get("&yucy;"), do: [1102]
+  def get("&yuml"), do: [255]
+  def get("&yuml;"), do: [255]
+  def get("&zacute;"), do: [378]
+  def get("&zcaron;"), do: [382]
+  def get("&zcy;"), do: [1079]
+  def get("&zdot;"), do: [380]
+  def get("&zeetrf;"), do: [8488]
+  def get("&zeta;"), do: [950]
+  def get("&zfr;"), do: [120_119]
+  def get("&zhcy;"), do: [1078]
+  def get("&zigrarr;"), do: [8669]
+  def get("&zopf;"), do: [120_171]
+  def get("&zscr;"), do: [120_015]
+  def get("&zwj;"), do: [8205]
+  def get("&zwnj;"), do: [8204]
+  def get(_), do: []
+end
diff --git a/lib/floki/html/numeric_charref.ex b/lib/floki/html/numeric_charref.ex
new file mode 100644
index 00000000..4e6da461
--- /dev/null
+++ b/lib/floki/html/numeric_charref.ex
@@ -0,0 +1,108 @@
+defmodule Floki.HTML.NumericCharref do
+  @moduledoc false
+
+  # REPLACEMENT CHARACTER
+  def to_unicode_number(0x00), do: {:ok, {:table, 0xFFFD}}
+  # EURO SIGN (€)
+  def to_unicode_number(0x80), do: {:ok, {:table, 0x20AC}}
+  # SINGLE LOW-9 QUOTATION MARK (‚)
+  def to_unicode_number(0x82), do: {:ok, {:table, 0x201A}}
+  # LATIN SMALL LETTER F WITH HOOK (ƒ)
+  def to_unicode_number(0x83), do: {:ok, {:table, 0x0192}}
+  # DOUBLE LOW-9 QUOTATION MARK („)
+  def to_unicode_number(0x84), do: {:ok, {:table, 0x201E}}
+  # HORIZONTAL ELLIPSIS (…)
+  def to_unicode_number(0x85), do: {:ok, {:table, 0x2026}}
+  # DAGGER (†)
+  def to_unicode_number(0x86), do: {:ok, {:table, 0x2020}}
+  # DOUBLE DAGGER (‡)
+  def to_unicode_number(0x87), do: {:ok, {:table, 0x2021}}
+  # MODIFIER LETTER CIRCUMFLEX ACCENT (ˆ)
+  def to_unicode_number(0x88), do: {:ok, {:table, 0x02C6}}
+  # PER MILLE SIGN (‰)
+  def to_unicode_number(0x89), do: {:ok, {:table, 0x2030}}
+  # LATIN CAPITAL LETTER S WITH CARON (Š)
+  def to_unicode_number(0x8A), do: {:ok, {:table, 0x0160}}
+  # SINGLE LEFT-POINTING ANGLE QUOTATION MARK (‹)
+  def to_unicode_number(0x8B), do: {:ok, {:table, 0x2039}}
+  # LATIN CAPITAL LIGATURE OE (Œ)
+  def to_unicode_number(0x8C), do: {:ok, {:table, 0x0152}}
+  # LATIN CAPITAL LETTER Z WITH CARON (Ž)
+  def to_unicode_number(0x8E), do: {:ok, {:table, 0x017D}}
+  # LEFT SINGLE QUOTATION MARK (‘)
+  def to_unicode_number(0x91), do: {:ok, {:table, 0x2018}}
+  # RIGHT SINGLE QUOTATION MARK (’)
+  def to_unicode_number(0x92), do: {:ok, {:table, 0x2019}}
+  # LEFT DOUBLE QUOTATION MARK (“)
+  def to_unicode_number(0x93), do: {:ok, {:table, 0x201C}}
+  # RIGHT DOUBLE QUOTATION MARK (”)
+  def to_unicode_number(0x94), do: {:ok, {:table, 0x201D}}
+  # BULLET (•)
+  def to_unicode_number(0x95), do: {:ok, {:table, 0x2022}}
+  # EN DASH (–)
+  def to_unicode_number(0x96), do: {:ok, {:table, 0x2013}}
+  # EM DASH (—)
+  def to_unicode_number(0x97), do: {:ok, {:table, 0x2014}}
+  # SMALL TILDE (˜)
+  def to_unicode_number(0x98), do: {:ok, {:table, 0x02DC}}
+  # TRADE MARK SIGN (™)
+  def to_unicode_number(0x99), do: {:ok, {:table, 0x2122}}
+  # LATIN SMALL LETTER S WITH CARON (š)
+  def to_unicode_number(0x9A), do: {:ok, {:table, 0x0161}}
+  # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK (›)
+  def to_unicode_number(0x9B), do: {:ok, {:table, 0x203A}}
+  # LATIN SMALL LIGATURE OE (œ)
+  def to_unicode_number(0x9C), do: {:ok, {:table, 0x0153}}
+  # LATIN SMALL LETTER Z WITH CARON (ž)
+  def to_unicode_number(0x9E), do: {:ok, {:table, 0x017E}}
+  # LATIN CAPITAL LETTER Y WITH DIAERESIS (Ÿ)
+  def to_unicode_number(0x9F), do: {:ok, {:table, 0x0178}}
+
+  def to_unicode_number(number) when number in 0xD800..0xDFFF or number > 0x10FFFF,
+    do: {:ok, {:range_one, 0xFFFD}}
+
+  def to_unicode_number(number)
+      when number in 0x0001..0x0008 or number in 0x000D..0x001F or number in 0x007F..0x009F or
+             number in 0xFDD0..0xFDEF or
+             number in [
+               0x000B,
+               0xFFFE,
+               0xFFFF,
+               0x1FFFE,
+               0x1FFFF,
+               0x2FFFE,
+               0x2FFFF,
+               0x3FFFE,
+               0x3FFFF,
+               0x4FFFE,
+               0x4FFFF,
+               0x5FFFE,
+               0x5FFFF,
+               0x6FFFE,
+               0x6FFFF,
+               0x7FFFE,
+               0x7FFFF,
+               0x8FFFE,
+               0x8FFFF,
+               0x9FFFE,
+               0x9FFFF,
+               0xAFFFE,
+               0xAFFFF,
+               0xBFFFE,
+               0xBFFFF,
+               0xCFFFE,
+               0xCFFFF,
+               0xDFFFE,
+               0xDFFFF,
+               0xEFFFE,
+               0xEFFFF,
+               0xFFFFE,
+               0xFFFFF,
+               0x10FFFE,
+               0x10FFFF
+             ] do
+    {:ok, {:list_of_errors, number}}
+  end
+
+  def to_unicode_number(number), do: {:ok, {:unicode, number}}
+end
diff --git a/lib/floki/html/tokenizer.ex b/lib/floki/html/tokenizer.ex
new file mode 100644
index 00000000..d9676510
--- /dev/null
+++ b/lib/floki/html/tokenizer.ex
@@ -0,0 +1,2867 @@
+defmodule Floki.HTML.Tokenizer do
+  @moduledoc false
+
+  # HTML tokenizer built according to the specs of WHATWG/W3C.
+  # https://html.spec.whatwg.org/multipage/#toc-syntax
+  #
+  # In order to find the docs of a given state, add it as an anchor to the link above.
+  # Example: https://html.spec.whatwg.org/multipage/parsing.html#data-state
+  #
+  # The tests for this module can be found in test/floki/html/generated/tokenizer.
+  # They were generated based on test files from https://github.com/html5lib/html5lib-tests
+  # In order to update those test files you first need to run the task:
+  #
+  #     mix generate_tokenizer_tests filename.tests
+  #
+  # Where "filename.tests" is a file present in "test/html5lib-tests/tokenizer" directory.
+  #
+  # This tokenizer depends on an entities list that is generated with another mix task.
+  # That file shouldn't change much, but if needed, it can be updated with:
+  #
+  #     mix generate_entities
+  #
+  # This tokenizer does not work with streams yet.
+
+  defmodule Doctype do
+    @moduledoc false
+
+    defstruct name: nil,
+              public_id: nil,
+              system_id: nil,
+              force_quirks: :off
+
+    @type t :: %__MODULE__{
+            name: iodata(),
+            public_id: iodata() | nil,
+            system_id: iodata() | nil,
+            force_quirks: :on | :off
+          }
+  end
+
+  defmodule Attribute do
+    @moduledoc false
+
+    defstruct name: "", value: ""
+
+    @type t :: %__MODULE__{
+            name: iodata(),
+            value: iodata()
+          }
+  end
+
+  defmodule StartTag do
+    @moduledoc false
+
+    defstruct name: "",
+              self_close: nil,
+              attributes: []
+
+    @type t :: %__MODULE__{
+            name: iodata(),
+            self_close: boolean() | nil,
+            attributes: list(Attribute.t())
+          }
+  end
+
+  defmodule EndTag do
+    @moduledoc false
+
+    defstruct name: "",
+              self_close: nil,
+              attributes: []
+
+    @type t :: %__MODULE__{
+            name: iodata(),
+            self_close: boolean() | nil,
+            attributes: list(Attribute.t())
+          }
+  end
+
+  defmodule Comment do
+    @moduledoc false
+
+    defstruct data: ""
+
+    @type t :: %__MODULE__{
+            data: iodata()
+          }
+  end
+
+  defmodule CharrefState do
+    @moduledoc false
+
+    defstruct candidate: nil, done: false, length: 0
+
+    @type t :: %__MODULE__{
+            candidate: binary(),
+            done: boolean(),
+            length: integer()
+          }
+  end
+
+  # It represents the state of tokenization.
+  defmodule State do
+    @moduledoc false
+
+    defstruct return_state: nil,
+              eof_last_state: nil,
+              adjusted_current_node: nil,
+              token: nil,
+              tokens: [],
+              buffer: "",
+              last_start_tag: nil,
+              errors: [],
+              emit: nil,
+              charref_state: nil,
+              charref_code: nil
+
+    @type token :: Doctype.t() | Comment.t() | StartTag.t() | EndTag.t() | {:char, iodata()}
+
+    @type t :: %__MODULE__{
+            return_state:
+              :data
+              | :rcdata
+              | :attribute_value_double_quoted
+              | :attribute_value_single_quoted
+              | :attribute_value_unquoted,
+            eof_last_state: atom(),
+            buffer: iodata(),
+            token: token() | nil,
+            tokens: list(token()),
+            errors: [{:parse_error, binary() | nil}],
+            last_start_tag: StartTag.t(),
+            charref_state: CharrefState.t(),
+            charref_code: integer(),
+            emit: (token() -> token())
+          }
+  end
+
+  @lower_ASCII_letters ?a..?z
+  @upper_ASCII_letters ?A..?Z
+  @ascii_digits ?0..?9
+  @space_chars [?\t, ?\n, ?\f, ?\s]
+
+  defguardp is_lower_letter(c) when c in @lower_ASCII_letters
+  defguardp is_upper_letter(c) when c in @upper_ASCII_letters
+  defguardp is_digit(c) when c in @ascii_digits
+  defguardp is_letter(c) when c in @upper_ASCII_letters or c in @lower_ASCII_letters
+  defguardp is_space(c) when c in @space_chars
+
+  @less_than_sign ?<
+  @greater_than_sign ?>
+  @exclamation_mark ?!
+  @solidus ?/
+  @hyphen_minus ?-
+  @replacement_char 0xFFFD
+
+  @spec tokenize(binary()) :: State.t()
+  def tokenize(html) do
+    pattern = :binary.compile_pattern(["\r\n", "\r"])
+
+    html
+    |> String.replace(pattern, "\n")
+    |> data(%State{emit: fn token -> token end})
+  end
+
+  # It assumes that the parser stops at the end of file.
+  # If we need to work with streams, this can't reverse here.
+  defp eof(last_state, s) do
+    %{
+      s
+      | eof_last_state: last_state,
+        tokens: Enum.reverse([:eof | s.tokens]),
+        errors: Enum.reverse(s.errors)
+    }
+  end
+
+  # § tokenizer-data-state
+
+  defp data(<<?&, html::binary>>, s) do
+    character_reference(html, %{s | return_state: :data})
+  end
+
+  defp data(<<?<, html::binary>>, s) do
+    tag_open(html, s)
+  end
+
+  defp data(<<0, html::binary>>, s) do
+    data(html, %{s | tokens: append_char_token(s, 0)})
+  end
+
+  defp data("", s) do
+    eof(:data, s)
+  end
+
+  defp data(<<c::utf8, html::binary>>, s) do
+    data(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-rcdata-state: re-entrant
+
+  @spec rcdata(binary(), %State{}) :: %State{}
+  def rcdata(<<?&, html::binary>>, s) do
+    character_reference(html, %{s | return_state: :rcdata})
+  end
+
+  def rcdata(<<?<, html::binary>>, s) do
+    rcdata_less_than_sign(html, s)
+  end
+
+  def rcdata(<<0, html::binary>>, s) do
+    rcdata(html, %{s | tokens: append_char_token(s, @replacement_char)})
+  end
+
+  def rcdata("", s) do
+    eof(:rcdata, s)
+  end
+
+  def rcdata(<<c::utf8, html::binary>>, s) do
+    rcdata(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-rawtext-state: re-entrant
+
+  @spec rawtext(binary(), State.t()) :: State.t()
+  def rawtext(<<?<, html::binary>>, s) do
+    rawtext_less_than_sign(html, s)
+  end
+
+  def rawtext(<<0, html::binary>>, s) do
+    rawtext(html, %{s | tokens: append_char_token(s, @replacement_char)})
+  end
+
+  def rawtext("", s) do
+    eof(:rawtext, s)
+  end
+
+  def rawtext(<<c::utf8, html::binary>>, s) do
+    rawtext(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-script-data-state: re-entrant
+
+  @spec script_data(binary(), State.t()) :: State.t()
+  def script_data(<<?<, html::binary>>, s) do
+    script_data_less_than_sign(html, s)
+  end
+
+  def script_data(<<0, html::binary>>, s) do
+    script_data(html, %{s | tokens: append_char_token(s, @replacement_char)})
+  end
+
+  def script_data("", s) do
+    eof(:script_data, s)
+  end
+
+  def script_data(<<c::utf8, html::binary>>, s) do
+    script_data(html, %{
+      s
+      | tokens: append_char_token(s, c)
+    })
+  end
+
+  # § tokenizer-plaintext-state: re-entrant
+
+  @spec plaintext(binary(), State.t()) :: State.t()
+  def plaintext(<<0, html::binary>>, s) do
+    plaintext(html, %{s | tokens: append_char_token(s, @replacement_char)})
+  end
+
+  def plaintext("", s) do
+    eof(:plaintext, s)
+  end
+
+  def plaintext(<<c::utf8, html::binary>>, s) do
+    plaintext(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-tag-open-state
+
+  defp tag_open(<<?!, html::binary>>, s) do
+    markup_declaration_open(html, s)
+  end
+
+  defp tag_open(<<?/, html::binary>>, s) do
+    end_tag_open(html, s)
+  end
+
+  defp tag_open(html = <<c, _rest::binary>>, s)
+       when is_letter(c) do
+    token = %StartTag{name: ""}
+
+    tag_name(html, %{s | token: token})
+  end
+
+  defp tag_open(html = <<??, _rest::binary>>, s) do
+    token = %Comment{data: ""}
+
+    bogus_comment(html, %{s | token: token})
+  end
+
+  defp tag_open(html, s) do
+    data(html, %{
+      s
+      | token: nil,
+        tokens: append_char_token(s, @less_than_sign)
+    })
+  end
+
+  # § tokenizer-end-tag-open-state
+
+  defp end_tag_open(html = <<c, _rest::binary>>, s)
+       when is_letter(c) do
+    token = %EndTag{name: ""}
+
+    tag_name(html, %{s | token: token})
+  end
+
+  defp end_tag_open(<<?>, html::binary>>, s) do
+    data(html, %{s | token: nil})
+  end
+
+  defp end_tag_open("", s) do
+    eof(:data, %{
+      s
+      | token: nil,
+        tokens: append_char_token(s, [@less_than_sign, @solidus]),
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp end_tag_open(html, s) do
+    token = %Comment{data: ""}
+
+    bogus_comment(html, %{s | token: token})
+  end
+
+  # § tokenizer-tag-name-state
+
+  defp tag_name(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_attribute_name(html, s)
+  end
+
+  defp tag_name(<<?/, html::binary>>, s) do
+    self_closing_start_tag(html, s)
+  end
+
+  defp tag_name(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | last_start_tag: s.token,
+        tokens: [s.emit.(s.token) | s.tokens],
+        token: nil
+    })
+  end
+
+  defp tag_name(<<c, html::binary>>, s)
+       when is_upper_letter(c) do
+    new_token = %{s.token | name: [s.token.name | [c + 32]]}
+
+    tag_name(html, %{s | token: new_token})
+  end
+
+  defp tag_name(<<0, html::binary>>, s) do
+    tag_name(html, %{
+      s
+      | token: %{s.token | name: [s.token.name | [@replacement_char]]},
+        errors: [
+          {:parse_error, "unexpected-null-character"}
+          | s.errors
+        ]
+    })
+  end
+
+  defp tag_name("", s) do
+    eof(:tag_name, %{
+      s
+      | errors: [{:parse_error, "eof-in-tag"} | s.errors]
+    })
+  end
+
+  defp tag_name(<<c::utf8, html::binary>>, s) do
+    new_token = %{s.token | name: [s.token.name | [c]]}
+
+    tag_name(html, %{s | token: new_token})
+  end
+
+  # § tokenizer-rcdata-less-than-sign-state
+
+  defp rcdata_less_than_sign(<<?/, html::binary>>, s) do
+    rcdata_end_tag_open(html, %{s | buffer: ""})
+  end
+
+  defp rcdata_less_than_sign(html, s) do
+    rcdata(html, %{
+      s
+      | token: nil,
+        tokens: append_char_token(s, @less_than_sign)
+    })
+  end
+
+  # § tokenizer-rcdata-end-tag-open-state
+
+  defp rcdata_end_tag_open(
+         html = <<c, _rest::binary>>,
+         s
+       )
+       when is_letter(c) do
+    token = %EndTag{name: ""}
+    rcdata_end_tag_name(html, %{s | token: token})
+  end
+
+  defp rcdata_end_tag_open(html, s) do
+    rcdata(html, %{s | tokens: append_char_token(s, [@less_than_sign, @solidus])})
+  end
+
+  # § tokenizer-rcdata-end-tag-name-state
+
+  defp rcdata_end_tag_name(html = <<c, rest::binary>>, s)
+       when is_space(c) do
+    if appropriate_tag?(s) do
+      before_attribute_name(rest, s)
+    else
+      rcdata(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp rcdata_end_tag_name(html = <<?/, rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      self_closing_start_tag(rest, s)
+    else
+      rcdata(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp rcdata_end_tag_name(html = <<?>, rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      data(rest, %{
+        s
+        | token: nil,
+          tokens: [s.emit.(s.token) | s.tokens]
+      })
+    else
+      rcdata(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  # TODO: should we always declare %State{}?
+  defp rcdata_end_tag_name(<<c, html::binary>>, %State{} = s)
+       when is_upper_letter(c) do
+    c_downcased = c + 32
+    new_token = %{s.token | name: [s.token.name | [c_downcased]]}
+
+    rcdata(html, %{s | token: new_token, buffer: [s.buffer | [c_downcased]]})
+  end
+
+  defp rcdata_end_tag_name(<<c, html::binary>>, s)
+       when is_lower_letter(c) do
+    col = s.col + 1
+    new_token = %{s.token | name: [s.name | [c]]}
+
+    rcdata_end_tag_name(html, %{s | token: new_token, buffer: [s.buffer | [c]], col: col})
+  end
+
+  defp rcdata_end_tag_name(html, s) do
+    rcdata(html, %{
+      s
+      | tokens: tokens_for_inappropriate_end_tag(s),
+        buffer: ""
+    })
+  end
+
+  # § tokenizer-rawtext-end-tag-name-state
+
+  defp rawtext_end_tag_name(html = <<c::utf8, rest::binary>>, s)
+       when is_space(c) do
+    if appropriate_tag?(s) do
+      before_attribute_name(rest, s)
+    else
+      rawtext(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp rawtext_end_tag_name(html = <<"/", rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      self_closing_start_tag(rest, s)
+    else
+      rawtext(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp rawtext_end_tag_name(html = <<">", rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      data(rest, %{
+        s
+        | token: nil,
+          tokens: [s.emit.(s.token) | s.tokens]
+      })
+    else
+      rawtext(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp rawtext_end_tag_name(<<c, html::binary>>, s)
+       when is_upper_letter(c) do
+    new_token = %{s.token | name: [s.token.name | [c + 32]]}
+
+    rawtext(html, %{s | token: new_token, buffer: [s.buffer | [c]]})
+  end
+
+  defp rawtext_end_tag_name(<<c, html::binary>>, s)
+       when is_lower_letter(c) do
+    col = s.col + 1
+    new_token = %{s.token | name: [s.name | [c]]}
+
+    rawtext_end_tag_name(html, %{s | token: new_token, buffer: [s.buffer | [c]], col: col})
+  end
+
+  defp rawtext_end_tag_name(html, s) do
+    rawtext(html, %{
+      s
+      | tokens: tokens_for_inappropriate_end_tag(s),
+        buffer: ""
+    })
+  end
+
+  # § tokenizer-script-data-end-tag-name-state
+
+  defp script_data_end_tag_name(html = <<c, rest::binary>>, s)
+       when is_space(c) do
+    if appropriate_tag?(s) do
+      before_attribute_name(rest, s)
+    else
+      script_data(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp script_data_end_tag_name(html = <<?/, rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      self_closing_start_tag(rest, s)
+    else
+      script_data(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp script_data_end_tag_name(html = <<?>, rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      data(rest, %{
+        s
+        | token: nil,
+          tokens: [s.emit.(s.token) | s.tokens]
+      })
+    else
+      script_data(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  defp script_data_end_tag_name(<<c, html::binary>>, s)
+       when is_upper_letter(c) do
+    c_downcased = c + 32
+    new_token = %{s.token | name: [s.token.name | [c_downcased]]}
+
+    script_data(html, %{s | token: new_token, buffer: [s.buffer | [c_downcased]]})
+  end
+
+  defp script_data_end_tag_name(<<c, html::binary>>, s)
+       when is_lower_letter(c) do
+    new_token = %{s.token | name: [s.name | [c]]}
+
+    script_data_end_tag_name(html, %{s | token: new_token, buffer: [s.buffer | [c]]})
+  end
+
+  defp script_data_end_tag_name(html, s) do
+    script_data(html, %{
+      s
+      | tokens: tokens_for_inappropriate_end_tag(s),
+        buffer: ""
+    })
+  end
+
+  # § tokenizer-script-data-escaped-end-tag-name-state: re-entrant
+
+  @spec script_data_escaped_end_tag_name(binary(), State.t()) :: State.t()
+  def script_data_escaped_end_tag_name(html = <<c, rest::binary>>, s)
+      when is_space(c) do
+    if appropriate_tag?(s) do
+      before_attribute_name(rest, s)
+    else
+      script_data_escaped(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  def script_data_escaped_end_tag_name(html = <<?/, rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      self_closing_start_tag(rest, s)
+    else
+      script_data_escaped(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  def script_data_escaped_end_tag_name(html = <<?>, rest::binary>>, s) do
+    if appropriate_tag?(s) do
+      data(rest, %{
+        s
+        | token: nil,
+          tokens: [s.emit.(s.token) | s.tokens]
+      })
+    else
+      script_data_escaped(html, %{
+        s
+        | tokens: tokens_for_inappropriate_end_tag(s),
+          buffer: ""
+      })
+    end
+  end
+
+  def script_data_escaped_end_tag_name(<<c, html::binary>>, s)
+      when is_upper_letter(c) do
+    new_token = %{s.token | name: [s.name | [c + 32]]}
+
+    script_data_escaped(html, %{s | token: new_token, buffer: [s.buffer | [c]]})
+  end
+
+  def script_data_escaped_end_tag_name(<<c, html::binary>>, s)
+      when is_lower_letter(c) do
+    new_token = %{s.token | name: [s.token.name | [c]]}
+
+    script_data_escaped_end_tag_name(html, %{
+      s
+      | token: new_token,
+        buffer: [s.buffer | [c]]
+    })
+  end
+
+  def script_data_escaped_end_tag_name(html, s) do
+    script_data_escaped(html, %{
+      s
+      | tokens: tokens_for_inappropriate_end_tag(s),
+        buffer: ""
+    })
+  end
+
+  # § tokenizer-rawtext-less-than-sign-state
+
+  defp rawtext_less_than_sign(<<?/, html::binary>>, s) do
+    rawtext_end_tag_open(html, %{s | buffer: ""})
+  end
+
+  defp rawtext_less_than_sign(html, s) do
+    rawtext(html, %{s | tokens: append_char_token(s, 0x003C)})
+  end
+
+  # § tokenizer-rawtext-end-tag-open-state
+
+  defp rawtext_end_tag_open(
+         html = <<c, _rest::binary>>,
+         s
+       )
+       when is_letter(c) do
+    token = %EndTag{name: ""}
+    rawtext_end_tag_name(html, %{s | token: token})
+  end
+
+  defp rawtext_end_tag_open(html, s) do
+    rawtext(html, %{s | tokens: append_char_token(s, [@less_than_sign, @solidus])})
+  end
+
+  # § tokenizer-script-data-less-than-sign-state
+
+  defp script_data_less_than_sign(<<?/, html::binary>>, s) do
+    script_data_end_tag_open(html, %{s | buffer: ""})
+  end
+
+  defp script_data_less_than_sign(<<?!, html::binary>>, s) do
+    script_data_less_than_sign(html, %{
+      s
+      | tokens: append_char_token(s, [@less_than_sign, @exclamation_mark])
+    })
+  end
+
+  defp script_data_less_than_sign(html, s) do
+    script_data(html, %{s | tokens: append_char_token(s, @less_than_sign)})
+  end
+
+  # § tokenizer-script-data-end-tag-open-state
+
+  defp script_data_end_tag_open(
+         html = <<c, _rest::binary>>,
+         s
+       )
+       when is_letter(c) do
+    end_tag = %EndTag{name: ""}
+    script_data_end_tag_name(html, %{s | token: end_tag})
+  end
+
+  defp script_data_end_tag_open(html, s) do
+    script_data(html, %{
+      s
+      | tokens: append_char_token(s, [@less_than_sign, @solidus])
+    })
+  end
+
+  # § tokenizer-script-data-escape-start-state: re-entrant
+
+  @spec script_data_escape_start(binary(), State.t()) :: State.t()
+  def script_data_escape_start(<<?-, html::binary>>, s) do
+    script_data_escape_start_dash(
+      html,
+      %{
+        s
+        | tokens: append_char_token(s, @hyphen_minus)
+      }
+    )
+  end
+
+  def script_data_escape_start(html, s) do
+    script_data(html, s)
+  end
+
+  # § tokenizer-script-data-escape-start-dash-state
+
+  defp script_data_escape_start_dash(<<?-, html::binary>>, s) do
+    script_data_escaped_dash_dash(
+      html,
+      %{
+        s
+        | tokens: append_char_token(s, @hyphen_minus)
+      }
+    )
+  end
+
+  defp script_data_escape_start_dash(html, s) do
+    script_data(html, s)
+  end
+
+  # § tokenizer-script-data-escaped-state
+
+  defp script_data_escaped(<<?-, html::binary>>, s) do
+    script_data_escaped_dash(
+      html,
+      %{s | tokens: append_char_token(s, @hyphen_minus)}
+    )
+  end
+
+  defp script_data_escaped(<<?<, html::binary>>, s) do
+    script_data_escaped_less_than_sign(html, s)
+  end
+
+  defp script_data_escaped(<<0, html::binary>>, s) do
+    script_data_escaped(html, %{s | tokens: append_char_token(s, @replacement_char)})
+  end
+
+  defp script_data_escaped("", s) do
+    eof(:script_data_escaped, s)
+  end
+
+  defp script_data_escaped(<<c::utf8, html::binary>>, s) do
+    script_data_escaped(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-script-data-escaped-dash-state
+
+  defp script_data_escaped_dash(<<?-, html::binary>>, s) do
+    script_data_escaped_dash_dash(
+      html,
+      %{
+        s
+        | tokens: append_char_token(s, @hyphen_minus)
+      }
+    )
+  end
+
+  defp script_data_escaped_dash(<<?<, html::binary>>, s) do
+    script_data_escaped_less_than_sign(html, s)
+  end
+
+  defp script_data_escaped_dash(<<0, html::binary>>, s) do
+    script_data_escaped(html, %{
+      s
+      | tokens: append_char_token(s, @replacement_char)
+    })
+  end
+
+  defp script_data_escaped_dash("", s) do
+    eof(:tokenize, s)
+  end
+
+  defp script_data_escaped_dash(
+         <<c::utf8, html::binary>>,
+         s
+       ) do
+    script_data_escaped(html, %{
+      s
+      | tokens: append_char_token(s, c)
+    })
+  end
+
+  # § tokenizer-script-data-escaped-dash-dash-state
+
+  defp script_data_escaped_dash_dash(<<?-, html::binary>>, s) do
+    script_data_escaped_dash_dash(
+      html,
+      %{s | tokens: append_char_token(s, @hyphen_minus)}
+    )
+  end
+
+  defp script_data_escaped_dash_dash(<<?<, html::binary>>, s) do
+    script_data_escaped_less_than_sign(html, s)
+  end
+
+  defp script_data_escaped_dash_dash(<<?>, html::binary>>, s) do
+    script_data(html, %{
+      s
+      | tokens: append_char_token(s, @greater_than_sign)
+    })
+  end
+
+  defp script_data_escaped_dash_dash(<<0, html::binary>>, s) do
+    script_data_escaped(html, %{
+      s
+      | tokens: append_char_token(s, @replacement_char)
+    })
+  end
+
+  defp script_data_escaped_dash_dash("", s) do
+    eof(:script_data_escaped_dash_dash, s)
+  end
+
+  defp script_data_escaped_dash_dash(
+         <<c::utf8, html::binary>>,
+         s
+       ) do
+    script_data_escaped(html, %{
+      s
+      | tokens: append_char_token(s, <<c::utf8>>)
+    })
+  end
+
+  # § tokenizer-script-data-escaped-less-than-sign-state
+
+  defp script_data_escaped_less_than_sign(<<?/, html::binary>>, s) do
+    script_data_escaped_end_tag_open(html, %{s | buffer: ""})
+  end
+
+  defp script_data_escaped_less_than_sign(
+         html = <<c, _rest::binary>>,
+         s
+       )
+       when is_lower_letter(c) or is_upper_letter(c) do
+    # TODO: revert this after implement the script_data_double_scape_start state
+    # script_data_double_escape_start(
+    data(
+      html,
+      %{
+        s
+        | buffer: "",
+          tokens: append_char_token(s, @less_than_sign)
+      }
+    )
+  end
+
+  defp script_data_escaped_less_than_sign(html, s) do
+    script_data_escaped(html, %{
+      s
+      | tokens: append_char_token(s, @less_than_sign)
+    })
+  end
+
+  # § tokenizer-script-data-escaped-end-tag-open-state
+
+  defp script_data_escaped_end_tag_open(
+         html = <<c, _rest::binary>>,
+         s
+       )
+       when is_lower_letter(c) or is_upper_letter(c) do
+    script_data_escaped_end_tag_name(
+      html,
+      %{
+        s
+        | token: %EndTag{name: ""}
+      }
+    )
+  end
+
+  defp script_data_escaped_end_tag_open(html, s) do
+    script_data_escaped(html, %{
+      s
+      | tokens: append_char_token(s, [@less_than_sign, @solidus])
+    })
+  end
+
+  # § tokenizer-script-data-double-escape-start-state: re-entrant
+
+  @spec script_data_double_escaped_end_tag_open(binary(), State.t()) :: State.t()
+  def script_data_double_escaped_end_tag_open(
+        <<c, html::binary>>,
+        s
+      )
+      when c in [@solidus, @greater_than_sign | @space_chars] do
+    s = %{s | tokens: append_char_token(s, <<c::utf8>>)}
+
+    if s.buffer && IO.chardata_to_string(s.buffer) == "script" do
+      script_data_double_escaped(html, s)
+    else
+      script_data_escaped(html, s)
+    end
+  end
+
+  def script_data_double_escaped_end_tag_open(
+        <<c, html::binary>>,
+        s
+      )
+      when is_upper_letter(c) do
+    script_data_double_escaped_end_tag_open(html, %{
+      s
+      | buffer: [s.buffer, c + 32],
+        tokens: append_char_token(s, c)
+    })
+  end
+
+  def script_data_double_escaped_end_tag_open(
+        <<c, html::binary>>,
+        s
+      )
+      when is_lower_letter(c) do
+    script_data_double_escaped_end_tag_open(html, %{
+      s
+      | buffer: [s.buffer, c],
+        tokens: append_char_token(s, c)
+    })
+  end
+
+  def script_data_double_escaped_end_tag_open(html, s) do
+    script_data_escaped(html, s)
+  end
+
+  # § tokenizer-script-data-double-escaped-state: re-entrant
+
+  @spec script_data_double_escaped(binary(), State.t()) :: State.t()
+  def script_data_double_escaped(<<?-, html::binary>>, s) do
+    script_data_double_escaped_dash(html, %{
+      s
+      | tokens: append_char_token(s, @hyphen_minus)
+    })
+  end
+
+  def script_data_double_escaped(<<?<, html::binary>>, s) do
+    script_data_double_escaped_less_than_sign(html, %{
+      s
+      | tokens: append_char_token(s, @less_than_sign)
+    })
+  end
+
+  def script_data_double_escaped(<<0, html::binary>>, s) do
+    script_data_double_escaped(html, %{s | tokens: append_char_token(s, @replacement_char)})
+  end
+
+  def script_data_double_escaped("", s) do
+    eof(:script_data_double_escaped, s)
+  end
+
+  def script_data_double_escaped(<<c::utf8, html::binary>>, s) do
+    script_data_double_escaped(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-script-data-double-escaped-dash-state
+
+  defp script_data_double_escaped_dash(<<?-, html::binary>>, s) do
+    script_data_double_escaped_dash_dash(html, %{
+      s
+      | tokens: append_char_token(s, @hyphen_minus)
+    })
+  end
+
+  defp script_data_double_escaped_dash(<<?<, html::binary>>, s) do
+    script_data_double_escaped_less_than_sign(html, %{
+      s
+      | tokens: append_char_token(s, @less_than_sign)
+    })
+  end
+
+  defp script_data_double_escaped_dash(<<0, html::binary>>, s) do
+    script_data_double_escaped(html, %{
+      s
+      | tokens: append_char_token(s, @replacement_char)
+    })
+  end
+
+  defp script_data_double_escaped_dash("", s) do
+    eof(:script_data_double_escaped_dash, s)
+  end
+
+  defp script_data_double_escaped_dash(<<c::utf8, html::binary>>, s) do
+    script_data_double_escaped(html, %{
+      s
+      | tokens: append_char_token(s, c)
+    })
+  end
+
+  # § tokenizer-script-data-double-escaped-dash-dash-state
+
+  defp script_data_double_escaped_dash_dash(<<?-, html::binary>>, s) do
+    script_data_double_escaped_dash_dash(html, %{
+      s
+      | tokens: append_char_token(s, @hyphen_minus)
+    })
+  end
+
+  defp script_data_double_escaped_dash_dash(<<?<, html::binary>>, s) do
+    script_data_double_escaped_less_than_sign(html, %{
+      s
+      | tokens: append_char_token(s, @less_than_sign)
+    })
+  end
+
+  defp script_data_double_escaped_dash_dash(<<?>, html::binary>>, s) do
+    script_data(html, %{
+      s
+      | tokens: append_char_token(s, @greater_than_sign)
+    })
+  end
+
+  defp script_data_double_escaped_dash_dash(
+         <<0, html::binary>>,
+         s
+       ) do
+    script_data_double_escaped(html, %{
+      s
+      | tokens: append_char_token(s, @replacement_char)
+    })
+  end
+
+  defp script_data_double_escaped_dash_dash("", s) do
+    eof(:script_data_double_escaped_dash_dash, s)
+  end
+
+  defp script_data_double_escaped_dash_dash(
+         <<c::utf8, html::binary>>,
+         s
+       ) do
+    script_data_double_escaped(html, %{
+      s
+      | tokens: append_char_token(s, c)
+    })
+  end
+
+  # § tokenizer-script-data-double-escaped-less-than-sign-state
+
+  defp script_data_double_escaped_less_than_sign(
+         <<?/, html::binary>>,
+         s
+       ) do
+    script_data_double_escape_end(html, %{
+      s
+      | buffer: "",
+        tokens: append_char_token(s, @solidus)
+    })
+  end
+
+  defp script_data_double_escaped_less_than_sign(html, s) do
+    script_data_double_escaped(html, s)
+  end
+
+  # § tokenizer-script-data-double-escape-end-state
+
+  defp script_data_double_escape_end(
+         <<c, html::binary>>,
+         s
+       )
+       when c in [?/, ?> | @space_chars] do
+    if IO.chardata_to_string(s.buffer) == "script" do
+      script_data_escaped(html, %{s | tokens: append_char_token(s, c)})
+    else
+      script_data_double_escaped(html, %{s | tokens: append_char_token(s, c)})
+    end
+  end
+
+  defp script_data_double_escape_end(
+         <<c, html::binary>>,
+         s
+       )
+       when is_upper_letter(c) do
+    script_data_double_escape_end(html, %{
+      s
+      | buffer: [s.buffer | [c + 32]],
+        tokens: append_char_token(s, c)
+    })
+  end
+
+  defp script_data_double_escape_end(
+         <<c, html::binary>>,
+         s
+       )
+       when is_lower_letter(c) do
+    script_data_double_escape_end(html, %{
+      s
+      | buffer: [s.buffer | [c]],
+        tokens: append_char_token(s, c)
+    })
+  end
+
+  defp script_data_double_escape_end(html, s) do
+    script_data_double_escaped(html, s)
+  end
+
+  # § tokenizer-before-attribute-name-state
+
+  defp before_attribute_name(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_attribute_name(html, s)
+  end
+
+  defp before_attribute_name(html = <<c, _rest::binary>>, s)
+       when c in [?/, ?>] do
+    after_attribute_name(html, s)
+  end
+
+  defp before_attribute_name("", s) do
+    after_attribute_name("", s)
+  end
+
+  defp before_attribute_name(<<?=, html::binary>>, s) do
+    new_token = %StartTag{
+      s.token
+      | attributes: [
+          %Attribute{name: "=", value: ""} | s.token.attributes
+        ]
+    }
+
+    attribute_name(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        token: new_token
+    })
+  end
+
+  defp before_attribute_name(html, s) do
+    # NOTE: token here can be a StartTag or EndTag. Attributes on end tags will be ignored.
+    new_token = %{
+      s.token
+      | attributes: [
+          %Attribute{name: "", value: ""} | s.token.attributes
+        ]
+    }
+
+    attribute_name(html, %{
+      s
+      | token: new_token
+    })
+  end
+
+  # § tokenizer-attribute-name-state
+
+  defp attribute_name(html = <<c, _rest::binary>>, s)
+       when c in [@solidus, @greater_than_sign | @space_chars] do
+    # FIXME: before changing the state, verify if same attr already exists.
+    after_attribute_name(html, s)
+  end
+
+  defp attribute_name("", s) do
+    # FIXME: before changing the state, verify if same attr already exists.
+    after_attribute_name("", s)
+  end
+
+  defp attribute_name(<<?=, html::binary>>, s) do
+    # FIXME: before changing the state, verify if same attr already exists.
+    before_attribute_value(html, s)
+  end
+
+  defp attribute_name(<<c, html::binary>>, s)
+       when is_upper_letter(c) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | name: [attr.name | [c + 32]]}
+    new_token = %StartTag{s.token | attributes: [new_attr | attrs]}
+
+    attribute_name(html, %{s | token: new_token})
+  end
+
+  defp attribute_name(<<0, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | name: [attr.name | [@replacement_char]]}
+    new_token = %StartTag{s.token | attributes: [new_attr | attrs]}
+
+    attribute_name(html, %{s | token: new_token})
+  end
+
+  defp attribute_name(<<c, html::binary>>, s)
+       when c in [?", ?', ?<] do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | name: [attr.name | [c]]}
+    new_token = %StartTag{s.token | attributes: [new_attr | attrs]}
+
+    attribute_name(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        token: new_token
+    })
+  end
+
+  defp attribute_name(<<c::utf8, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | name: [attr.name | [c]]}
+
+    # NOTE: token here can be a StartTag or EndTag. Attributes on end tags will be ignored.
+    new_token = %{s.token | attributes: [new_attr | attrs]}
+
+    attribute_name(html, %{s | token: new_token})
+  end
+
+  # § tokenizer-after-attribute-name-state
+
+  defp after_attribute_name(<<c, html::binary>>, s)
+       when is_space(c) do
+    after_attribute_name(html, s)
+  end
+
+  defp after_attribute_name(<<?/, html::binary>>, s) do
+    self_closing_start_tag(html, s)
+  end
+
+  defp after_attribute_name(<<?=, html::binary>>, s) do
+    before_attribute_value(html, s)
+  end
+
+  defp after_attribute_name(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil
+    })
+  end
+
+  defp after_attribute_name("", s) do
+    eof(:data, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_attribute_name(html, s) do
+    attribute = %Attribute{name: "", value: ""}
+    new_token = %StartTag{s.token | attributes: [attribute | s.token.attributes]}
+
+    attribute_name(html, %{s | token: new_token})
+  end
+
+  # § tokenizer-before-attribute-value-state
+
+  defp before_attribute_value(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_attribute_value(html, s)
+  end
+
+  defp before_attribute_value(<<?", html::binary>>, s) do
+    attribute_value_double_quoted(html, s)
+  end
+
+  defp before_attribute_value(<<?', html::binary>>, s) do
+    attribute_value_single_quoted(html, s)
+  end
+
+  defp before_attribute_value(html = <<?>, _rest::binary>>, s) do
+    attribute_value_unquoted(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_attribute_value(html, s) do
+    attribute_value_unquoted(html, s)
+  end
+
+  # § tokenizer-attribute-value-double-quoted-state
+
+  defp attribute_value_double_quoted(<<?", html::binary>>, s) do
+    after_attribute_value_quoted(html, s)
+  end
+
+  defp attribute_value_double_quoted(<<?&, html::binary>>, s) do
+    character_reference(html, %{s | return_state: :attribute_value_double_quoted})
+  end
+
+  defp attribute_value_double_quoted(<<0, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [@replacement_char]]}
+
+    attribute_value_double_quoted(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        token: %StartTag{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  defp attribute_value_double_quoted("", s) do
+    eof(:attribute_value_double_quoted, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp attribute_value_double_quoted(<<c::utf8, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [c]]}
+
+    attribute_value_double_quoted(html, %{
+      s
+      | token: %StartTag{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  # § tokenizer-attribute-value-single-quoted-state
+
+  defp attribute_value_single_quoted(<<?', html::binary>>, s) do
+    after_attribute_value_quoted(html, s)
+  end
+
+  defp attribute_value_single_quoted(<<?&, html::binary>>, s) do
+    character_reference(html, %{s | return_state: :attribute_value_single_quoted})
+  end
+
+  defp attribute_value_single_quoted(<<0, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [@replacement_char]]}
+
+    attribute_value_single_quoted(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        token: %StartTag{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  defp attribute_value_single_quoted("", s) do
+    eof(:attribute_value_single_quoted, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp attribute_value_single_quoted(<<c::utf8, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [c]]}
+
+    # NOTE: token here can be a StartTag or EndTag. Attributes on end tags will be ignored.
+    attribute_value_single_quoted(html, %{
+      s
+      | token: %{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  # § tokenizer-attribute-value-unquoted-state
+
+  defp attribute_value_unquoted(<<c, html::binary>>, s) when is_space(c) do
+    before_attribute_name(html, s)
+  end
+
+  defp attribute_value_unquoted(<<?&, html::binary>>, s) do
+    character_reference(html, %{s | return_state: :attribute_value_unquoted})
+  end
+
+  defp attribute_value_unquoted(<<?>, html::binary>>, s) do
+    data(html, %{s | tokens: [s.emit.(s.token) | s.tokens], token: nil})
+  end
+
+  defp attribute_value_unquoted(<<0, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [@replacement_char]]}
+
+    attribute_value_unquoted(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        token: %{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  defp attribute_value_unquoted(<<c, html::binary>>, s)
+       when c in [?", ?', ?<, ?=, ?`] do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [c]]}
+
+    attribute_value_unquoted(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        token: %{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  defp attribute_value_unquoted("", s) do
+    eof(:attribute_value_unquoted, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp attribute_value_unquoted(<<c::utf8, html::binary>>, s) do
+    [attr | attrs] = s.token.attributes
+    new_attr = %Attribute{attr | value: [attr.value | [c]]}
+
+    attribute_value_unquoted(html, %{
+      s
+      | token: %{s.token | attributes: [new_attr | attrs]}
+    })
+  end
+
+  # § tokenizer-after-attribute-value-quoted-state
+
+  defp after_attribute_value_quoted(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_attribute_name(html, s)
+  end
+
+  defp after_attribute_value_quoted(<<?/, html::binary>>, s) do
+    self_closing_start_tag(html, s)
+  end
+
+  defp after_attribute_value_quoted(<<?>, html::binary>>, s) do
+    data(html, %{s | tokens: [s.emit.(s.token) | s.tokens], token: nil})
+  end
+
+  defp after_attribute_value_quoted("", s) do
+    eof(:after_attribute_value_quoted, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_attribute_value_quoted(html, s) do
+    before_attribute_name(html, s)
+  end
+
+  # § tokenizer-self-closing-start-tag-state
+
+  defp self_closing_start_tag(<<?>, html::binary>>, s) do
+    tag = %StartTag{s.token | self_close: true}
+    data(html, %{s | tokens: [tag | s.tokens], token: nil})
+  end
+
+  defp self_closing_start_tag("", s) do
+    eof(:self_closing_start_tag, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp self_closing_start_tag(html, s) do
+    before_attribute_name(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-bogus-comment-state
+
+  defp bogus_comment(<<?>, html::binary>>, s) do
+    data(html, %{s | tokens: [s.emit.(s.token) | s.tokens], token: nil})
+  end
+
+  defp bogus_comment("", s) do
+    eof(:bogus_comment, %{s | tokens: [s.emit.(s.token) | s.tokens], token: nil})
+  end
+
+  defp bogus_comment(<<0, html::binary>>, s) do
+    comment = %Comment{s.token | data: [s.token.data | [@replacement_char]]}
+
+    bogus_comment(html, %{s | token: comment})
+  end
+
+  defp bogus_comment(<<c::utf8, html::binary>>, s) do
+    comment = %Comment{s.token | data: [s.token.data | [c]]}
+
+    bogus_comment(html, %{s | token: comment})
+  end
+
+  # § tokenizer-markup-declaration-open-state
+
+  defp markup_declaration_open(<<"--", html::binary>>, s) do
+    token = %Comment{data: ""}
+
+    comment_start(
+      html,
+      %{s | token: token}
+    )
+  end
+
+  defp markup_declaration_open(
+         <<d, o, c, t, y, p, e, html::binary>>,
+         s
+       )
+       when d in [?D, ?d] and o in [?O, ?o] and c in [?C, ?c] and
+              t in [?T, ?t] and y in [?Y, ?y] and
+              p in [?P, ?p] and e in [?E, ?e] do
+    doctype(html, s)
+  end
+
+  # TODO: fix the check for adjusted current node in HTML namespace
+  defp markup_declaration_open(<<"[CDATA[", html::binary>>, s = %State{adjusted_current_node: n})
+       when not is_nil(n) do
+    cdata_section(html, s)
+  end
+
+  defp markup_declaration_open(html, s) do
+    bogus_comment(html, %{
+      s
+      | token: %Comment{},
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-comment-start-state
+
+  defp comment_start(<<?-, html::binary>>, s) do
+    comment_start_dash(html, s)
+  end
+
+  defp comment_start(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment_start(html, s) do
+    comment(html, s)
+  end
+
+  # § tokenizer-comment-start-dash-state
+
+  defp comment_start_dash(<<?-, html::binary>>, s) do
+    comment_end(html, s)
+  end
+
+  defp comment_start_dash(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment_start_dash("", s) do
+    eof(:comment_start_dash, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        tokens: [s.emit.(s.token) | s.tokens],
+        token: nil
+    })
+  end
+
+  defp comment_start_dash(html, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@hyphen_minus]]}
+
+    comment(html, %{s | token: new_comment})
+  end
+
+  # § tokenizer-comment-state
+
+  defp comment(<<?<, html::binary>>, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@less_than_sign]]}
+
+    comment_less_than_sign(html, %{s | token: new_comment})
+  end
+
+  defp comment(<<?-, html::binary>>, s) do
+    comment_end_dash(html, s)
+  end
+
+  defp comment(<<0, html::binary>>, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@replacement_char]]}
+
+    comment(html, %{
+      s
+      | token: new_comment,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment("", s) do
+    eof(:comment, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors],
+        tokens: [s.emit.(s.token) | s.tokens],
+        token: nil
+    })
+  end
+
+  defp comment(<<c::utf8, html::binary>>, s) do
+    new_token = %Comment{s.token | data: [s.token.data | [c]]}
+
+    comment(
+      html,
+      %{s | token: new_token}
+    )
+  end
+
+  # § tokenizer-comment-less-than-sign-state
+
+  defp comment_less_than_sign(<<?!, html::binary>>, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@exclamation_mark]]}
+
+    comment_less_than_sign_bang(html, %{s | token: new_comment})
+  end
+
+  defp comment_less_than_sign(<<?<, html::binary>>, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@less_than_sign]]}
+
+    comment_less_than_sign(html, %{s | token: new_comment})
+  end
+
+  defp comment_less_than_sign(html, s) do
+    comment(html, s)
+  end
+
+  # § tokenizer-comment-less-than-sign-bang-state
+
+  defp comment_less_than_sign_bang(<<?-, html::binary>>, s) do
+    comment_less_than_sign_bang_dash(html, s)
+  end
+
+  defp comment_less_than_sign_bang(html, s) do
+    comment(html, s)
+  end
+
+  # § tokenizer-comment-less-than-sign-bang-dash-state
+
+  defp comment_less_than_sign_bang_dash(<<?-, html::binary>>, s) do
+    comment_less_than_sign_bang_dash_dash(html, s)
+  end
+
+  defp comment_less_than_sign_bang_dash(html, s) do
+    comment_end_dash(html, s)
+  end
+
+  # § tokenizer-comment-less-than-sign-bang-dash-dash-state
+
+  defp comment_less_than_sign_bang_dash_dash(html = <<?>, _rest::binary>>, s) do
+    comment_end(html, s)
+  end
+
+  defp comment_less_than_sign_bang_dash_dash(html = "", s) do
+    comment_end(html, s)
+  end
+
+  defp comment_less_than_sign_bang_dash_dash(html, s) do
+    comment_end(html, %{s | errors: [{:parse_error, nil} | s.errors]})
+  end
+
+  # § tokenizer-comment-end-dash-state
+
+  defp comment_end_dash(<<?-, html::binary>>, s) do
+    comment_end(html, s)
+  end
+
+  defp comment_end_dash("", s) do
+    eof(:comment_end_dash, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment_end_dash(html, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@hyphen_minus]]}
+
+    comment(html, %{s | token: new_comment})
+  end
+
+  # § tokenizer-comment-end-state
+
+  defp comment_end(<<?>, html::binary>>, s) do
+    data(
+      html,
+      %{s | tokens: [s.emit.(s.token) | s.tokens], token: nil}
+    )
+  end
+
+  defp comment_end(<<?!, html::binary>>, s) do
+    comment_end_bang(html, s)
+  end
+
+  defp comment_end(<<?-, html::binary>>, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | [@hyphen_minus]]}
+
+    comment_end(html, %{s | token: new_comment})
+  end
+
+  defp comment_end("", s) do
+    eof(:comment_end, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment_end(html, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | "--"]}
+
+    comment(html, %{s | token: new_comment})
+  end
+
+  # § tokenizer-comment-end-bang-state
+
+  defp comment_end_bang(<<?-, html::binary>>, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | "--!"]}
+
+    comment_end_dash(html, %{s | token: new_comment})
+  end
+
+  defp comment_end_bang(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment_end_bang("", s) do
+    eof(:comment_end_bang, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp comment_end_bang(html, s) do
+    new_comment = %Comment{s.token | data: [s.token.data | "--!"]}
+
+    comment(html, %{s | token: new_comment})
+  end
+
+  # § tokenizer-doctype-state
+
+  defp doctype(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_doctype_name(html, s)
+  end
+
+  defp doctype("", s) do
+    doctype_token = %Doctype{force_quirks: :on}
+    eof(:doctype, %{s | tokens: [doctype_token | s.tokens], token: nil})
+  end
+
+  defp doctype(html, s) do
+    before_doctype_name(html, %{
+      s
+      | errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-before-doctype-name-state
+
+  defp before_doctype_name(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_doctype_name(html, s)
+  end
+
+  defp before_doctype_name(<<c, html::binary>>, s)
+       when is_upper_letter(c) do
+    token = %Doctype{name: [c + 32]}
+
+    doctype_name(html, %{s | token: token})
+  end
+
+  defp before_doctype_name(<<0, html::binary>>, s) do
+    token = %Doctype{
+      name: [@replacement_char],
+      force_quirks: :on
+    }
+
+    doctype_name(html, %{s | token: token})
+  end
+
+  defp before_doctype_name(<<?>, html::binary>>, s) do
+    token = %Doctype{
+      force_quirks: :on
+    }
+
+    data(html, %{
+      s
+      | tokens: [token | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_name("", s) do
+    token = %Doctype{
+      force_quirks: :on
+    }
+
+    eof(:before_doctype_name, %{
+      s
+      | tokens: [token | s.tokens],
+        token: nil,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_name(<<c::utf8, html::binary>>, s) do
+    token = %Doctype{
+      name: [c]
+    }
+
+    doctype_name(html, %{s | token: token})
+  end
+
+  # § tokenizer-doctype-name-state
+
+  defp doctype_name(<<c, html::binary>>, s)
+       when is_space(c) do
+    after_doctype_name(html, s)
+  end
+
+  defp doctype_name(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil
+    })
+  end
+
+  defp doctype_name(<<c, html::binary>>, s) when is_upper_letter(c) do
+    new_token = %Doctype{
+      s.token
+      | name: [s.token.name | [c + 32]]
+    }
+
+    doctype_name(html, %{s | token: new_token})
+  end
+
+  defp doctype_name(<<0, html::binary>>, s) do
+    new_token = %Doctype{s.token | name: [s.token.name | [@replacement_char]]}
+
+    doctype_name(html, %{
+      s
+      | token: new_token,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_name("", s) do
+    new_token = %Doctype{s.token | force_quirks: :on}
+
+    eof(:doctype_name, %{
+      s
+      | tokens: [new_token | s.tokens],
+        token: nil,
+        errors: [{:parse_error, "eof-in-doctype"} | s.errors]
+    })
+  end
+
+  defp doctype_name(<<c::utf8, html::binary>>, s) do
+    new_token = %Doctype{s.token | name: [s.token.name | [c]]}
+
+    doctype_name(html, %{s | token: new_token})
+  end
+
+  # § tokenizer-after-doctype-name-state
+
+  defp after_doctype_name(<<c, html::binary>>, s)
+       when is_space(c) do
+    after_doctype_name(html, s)
+  end
+
+  defp after_doctype_name(<<?>, html::binary>>, s) do
+    data(html, %{
+      s
+      | tokens: [s.emit.(s.token) | s.tokens],
+        token: nil
+    })
+  end
+
+  defp after_doctype_name("", s) do
+    token = %Doctype{s.token | force_quirks: :on}
+
+    eof(:after_doctype_name, %{
+      s
+      | tokens: [token | s.tokens],
+        token: nil,
+        errors: [{:parse_error, "eof-in-doctype"} | s.errors]
+    })
+  end
+
+  defp after_doctype_name(
+         <<p, u, b, l, i, c, html::binary>>,
+         s
+       )
+       when p in [?P, ?p] and u in [?U, ?u] and b in [?B, ?b] and
+              l in [?L, ?l] and i in [?I, ?i] and
+              c in [?C, ?c] do
+    after_doctype_public_keyword(html, s)
+  end
+
+  defp after_doctype_name(
+         <<s1, y, s2, t, e, m, html::binary>>,
+         state
+       )
+       when s1 in [?S, ?s] and y in [?Y, ?y] and
+              s2 in [?S, ?s] and t in [?T, ?t] and
+              e in [?E, ?e] and m in [?M, ?m] do
+    after_doctype_system_keyword(html, state)
+  end
+
+  defp after_doctype_name(html, s) do
+    token = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: token,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-after-doctype-public-keyword-state
+
+  defp after_doctype_public_keyword(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_doctype_public_identifier(html, s)
+  end
+
+  defp after_doctype_public_keyword(<<?", html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: ""}
+
+    doctype_public_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_keyword(<<?', html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: ""}
+
+    doctype_public_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_keyword(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_keyword("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:after_doctype_public_keyword, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_keyword(<<_c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-before-doctype-public-identifier-state
+
+  defp before_doctype_public_identifier(<<c, html::binary>>, s)
+       when is_space(c) do
+    before_doctype_public_identifier(html, s)
+  end
+
+  defp before_doctype_public_identifier(<<?", html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: ""}
+
+    doctype_public_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_public_identifier(<<?', html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: ""}
+
+    doctype_public_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_public_identifier(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_public_identifier("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:before_doctype_public_identifier, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_public_identifier(<<_::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-doctype-public-identifier-double-quoted-state
+
+  defp doctype_public_identifier_double_quoted(<<?", html::binary>>, s) do
+    after_doctype_public_identifier(html, s)
+  end
+
+  defp doctype_public_identifier_double_quoted(<<0, html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: [s.token.public_id | [@replacement_char]]}
+
+    doctype_public_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_public_identifier_double_quoted(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_public_identifier_double_quoted("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:doctype_public_identifier_double_quoted, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_public_identifier_double_quoted(<<c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: [s.token.public_id | [c]]}
+
+    doctype_public_identifier_double_quoted(html, %{s | token: doctype})
+  end
+
+  # § tokenizer-doctype-public-identifier-single-quoted-state
+
+  defp doctype_public_identifier_single_quoted(<<?', html::binary>>, s) do
+    after_doctype_public_identifier(html, s)
+  end
+
+  defp doctype_public_identifier_single_quoted(<<0, html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: [s.token.public_id | [@replacement_char]]}
+
+    doctype_public_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_public_identifier_single_quoted(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_public_identifier_single_quoted("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:doctype_public_identifier_single_quoted, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_public_identifier_single_quoted(<<c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | public_id: [s.token.public_id | [c]]}
+
+    doctype_public_identifier_single_quoted(html, %{s | token: doctype})
+  end
+
+  # § tokenizer-after-doctype-public-identifier-state
+
+  defp after_doctype_public_identifier(<<c, html::binary>>, s) when is_space(c) do
+    between_doctype_public_and_system_identifiers(html, s)
+  end
+
+  defp after_doctype_public_identifier(<<?>, html::binary>>, s) do
+    data(html, %{s | token: nil, tokens: [s.emit.(s.token) | s.tokens]})
+  end
+
+  defp after_doctype_public_identifier(<<?", html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_identifier(<<?', html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_identifier("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:after_doctype_public_identifier, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_public_identifier(<<_c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-between-doctype-public-and-system-identifiers-state
+
+  defp between_doctype_public_and_system_identifiers(<<c, html::binary>>, s) when is_space(c) do
+    between_doctype_public_and_system_identifiers(html, s)
+  end
+
+  defp between_doctype_public_and_system_identifiers(<<?>, html::binary>>, s) do
+    data(html, %{s | token: nil, tokens: [s.emit.(s.token) | s.tokens]})
+  end
+
+  defp between_doctype_public_and_system_identifiers(<<?", html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_double_quoted(html, %{s | token: doctype})
+  end
+
+  defp between_doctype_public_and_system_identifiers(<<?', html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_single_quoted(html, %{s | token: doctype})
+  end
+
+  defp between_doctype_public_and_system_identifiers("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:between_doctype_public_and_system_identifiers, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp between_doctype_public_and_system_identifiers(<<_c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-after-doctype-system-keyword-state
+
+  defp after_doctype_system_keyword(<<c, html::binary>>, s) when is_space(c) do
+    before_doctype_system_identifier(html, s)
+  end
+
+  defp after_doctype_system_keyword(<<?", html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_system_keyword(<<?', html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_system_keyword(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_system_keyword("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:after_doctype_system_keyword, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_system_keyword(<<_c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-before-doctype-system-identifier-state
+
+  defp before_doctype_system_identifier(<<c, html::binary>>, s) when is_space(c) do
+    before_doctype_system_identifier(html, s)
+  end
+
+  defp before_doctype_system_identifier(<<?", html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_system_identifier(<<?', html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: ""}
+
+    doctype_system_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_system_identifier(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_system_identifier("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:before_doctype_system_identifier, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp before_doctype_system_identifier(<<_::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    bogus_doctype(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-doctype-system-identifier-double-quoted-state
+
+  defp doctype_system_identifier_double_quoted(<<?", html::binary>>, s) do
+    after_doctype_system_identifier(html, s)
+  end
+
+  defp doctype_system_identifier_double_quoted(<<0, html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: [s.token.system_id | [@replacement_char]]}
+
+    doctype_system_identifier_double_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_system_identifier_double_quoted(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_system_identifier_double_quoted("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:doctype_system_identifier_double_quoted, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_system_identifier_double_quoted(<<c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: [s.token.system_id | [c]]}
+
+    doctype_system_identifier_double_quoted(html, %{s | token: doctype})
+  end
+
+  # § tokenizer-doctype-system-identifier-single-quoted-state
+
+  defp doctype_system_identifier_single_quoted(<<?', html::binary>>, s) do
+    after_doctype_system_identifier(html, s)
+  end
+
+  defp doctype_system_identifier_single_quoted(<<0, html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: [s.token.system_id | [@replacement_char]]}
+
+    doctype_system_identifier_single_quoted(html, %{
+      s
+      | token: doctype,
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_system_identifier_single_quoted(<<?>, html::binary>>, s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    data(html, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_system_identifier_single_quoted("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:doctype_system_identifier_single_quoted, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp doctype_system_identifier_single_quoted(<<c::utf8, html::binary>>, s) do
+    doctype = %Doctype{s.token | system_id: [s.token.system_id | [c]]}
+
+    doctype_system_identifier_single_quoted(html, %{s | token: doctype})
+  end
+
+  # § tokenizer-after-doctype-system-identifier-state
+
+  defp after_doctype_system_identifier(<<c, html::binary>>, s) when is_space(c) do
+    after_doctype_system_identifier(html, s)
+  end
+
+  defp after_doctype_system_identifier(<<?>, html::binary>>, s) do
+    data(html, %{s | token: nil, tokens: [s.emit.(s.token) | s.tokens]})
+  end
+
+  defp after_doctype_system_identifier("", s) do
+    doctype = %Doctype{s.token | force_quirks: :on}
+
+    eof(:after_doctype_system_identifier, %{
+      s
+      | token: nil,
+        tokens: [doctype | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  defp after_doctype_system_identifier(<<_c::utf8, html::binary>>, s) do
+    bogus_doctype(html, %{
+      s
+      | token: nil,
+        tokens: [s.emit.(s.token) | s.tokens],
+        errors: [{:parse_error, nil} | s.errors]
+    })
+  end
+
+  # § tokenizer-bogus-doctype-state
+
+  defp bogus_doctype(<<?>, html::binary>>, s) do
+    data(html, %{s | token: nil, tokens: [s.emit.(s.token) | s.tokens]})
+  end
+
+  defp bogus_doctype(<<0, html::binary>>, s) do
+    # TODO: set error
+    bogus_doctype(html, s)
+  end
+
+  defp bogus_doctype("", s) do
+    eof(:bogus_doctype, %{s | token: nil, tokens: [s.emit.(s.token) | s.tokens]})
+  end
+
+  defp bogus_doctype(<<_c::utf8, html::binary>>, s) do
+    bogus_doctype(html, s)
+  end
+
+  # § tokenizer-cdata-section-state
+
+  defp cdata_section(<<?], html::binary>>, s) do
+    cdata_section_bracket(html, s)
+  end
+
+  defp cdata_section("", s) do
+    eof(:cdata_section, %{s | errors: [{:parse_error, nil} | s.errors]})
+  end
+
+  defp cdata_section(<<c::utf8, html::binary>>, s) do
+    cdata_section(html, %{s | tokens: append_char_token(s, c)})
+  end
+
+  # § tokenizer-cdata-section-bracket-state
+
+  defp cdata_section_bracket(<<?], html::binary>>, s) do
+    cdata_section_end(html, s)
+  end
+
+  defp cdata_section_bracket(html, s) do
+    cdata_section(html, %{s | tokens: append_char_token(s, ?])})
+  end
+
+  # § tokenizer-cdata-section-end-state
+
+  defp cdata_section_end(<<?], html::binary>>, s) do
+    cdata_section_end(html, %{s | tokens: append_char_token(s, ?])})
+  end
+
+  defp cdata_section_end(<<?>, html::binary>>, s) do
+    data(html, s)
+  end
+
+  defp cdata_section_end(html, s) do
+    cdata_section(html, %{s | tokens: append_char_token(s, [?], ?]])})
+  end
+
+  # § tokenizer-character-reference-state
+
+  defp character_reference(<<c, _rest::binary>> = html, s)
+       when c in [?<, ?& | @space_chars] do
+    character_reference_end(html, %{s | buffer: "&"})
+  end
+
+  defp character_reference(<<?#, html::binary>>, s) do
+    numeric_character_reference(html, %{s | buffer: ["&" | [?#]]})
+  end
+
+  defp character_reference(html, s) do
+    seek_charref(html, %{s | buffer: "&", charref_state: %CharrefState{done: false}})
+  end
+
+  defp seek_charref(
+         <<c, html::binary>>,
+         s = %State{charref_state: %CharrefState{done: false}}
+       )
+       when c == ?; or is_letter(c) or
+              is_digit(c) do
+    buffer = IO.chardata_to_string([s.buffer | [c]])
+    candidate = Floki.Entities.get(buffer)
+
+    charref_state =
+      if candidate != [] do
+        %CharrefState{s.charref_state | candidate: buffer}
+      else
+        s.charref_state
+      end
+
+    len = charref_state.length + 1
+    done_by_length? = len > 60
+    done_by_semicolon? = c == ?;
+
+    seek_charref(html, %{
+      s
+      | buffer: buffer,
+        charref_state: %{
+          charref_state
+          | length: len,
+            done: done_by_semicolon? || done_by_length?
+        }
+    })
+  end
+
+  defp seek_charref(html, s) do
+    charref_state = %CharrefState{s.charref_state | done: true}
+
+    seek_charref_end(html, %{s | charref_state: charref_state})
+  end
+
+  defp seek_charref_end(html, s = %State{return_state: return_state})
+       when return_state in [
+              :attribute_value_double_quoted,
+              :attribute_value_single_quoted,
+              :attribute_value_unquoted
+            ] do
+    last_char =
+      s.buffer
+      |> IO.chardata_to_string()
+      |> String.codepoints()
+      |> List.last()
+
+    with true <- last_char != ";",
+         <<c, _html::binary>>
+         when c == ?= or is_letter(c) or
+                is_digit(c) <- html do
+      character_reference_end(html, s)
+    else
+      _ ->
+        buffer =
+          if s.buffer == s.charref_state.candidate do
+            character_buffer(s)
+          else
+            s.buffer
+          end
+
+        character_reference_end(html, %{s | buffer: buffer})
+    end
+  end
+
+  defp seek_charref_end(html, s) do
+    candidate = s.charref_state.candidate
+
+    ends_with_semicolon? = String.ends_with?(s.buffer, ";")
+
+    parse_error_on_unmatch? =
+      String.starts_with?(s.buffer, "&") && ends_with_semicolon? && candidate == nil
+
+    parse_error_on_non_semicolon_ending? = !ends_with_semicolon?
+
+    state =
+      cond do
+        parse_error_on_unmatch? ->
+          %{s | errors: [{:parse_error, nil} | s.errors]}
+
+        parse_error_on_non_semicolon_ending? ->
+          %{
+            s
+            | errors: [
+                {
+                  :parse_error,
+                  "missing-semicolon-after-character-reference"
+                }
+                | s.errors
+              ]
+          }
+
+        true ->
+          s
+      end
+
+    buffer = character_buffer(s)
+    html = charref_html_after_buffer(html, s)
+
+    character_reference_end(html, %{state | buffer: buffer})
+  end
+
+  defp character_buffer(%State{charref_state: %CharrefState{candidate: candidate}, buffer: buffer}) do
+    if candidate do
+      Floki.Entities.get(candidate)
+    else
+      buffer
+    end
+  end
+
+  ## Helper functions that modifies the HTML string.
+  # OPTIMIZE: avoid concatenation of string.
+  defp charref_html_after_buffer(html, %State{
+         charref_state: %CharrefState{candidate: candidate},
+         buffer: buffer
+       })
+       when is_binary(buffer) and is_binary(candidate) do
+    String.replace_prefix(buffer, candidate, "") <> html
+  end
+
+  defp charref_html_after_buffer(
+         html,
+         s = %State{
+           charref_state: %CharrefState{candidate: candidate}
+         }
+       )
+       when is_binary(candidate) do
+    String.replace_prefix(IO.chardata_to_string(s.buffer), candidate, "") <> html
+  end
+
+  defp charref_html_after_buffer(html, _), do: html
+
+  # § tokenizer-numeric-character-reference-state
+
+  defp numeric_character_reference(html, s) do
+    do_numeric_character_reference(html, %{s | charref_code: 0})
+  end
+
+  defp do_numeric_character_reference(<<c, html::binary>>, s)
+       when c in [?x, ?X] do
+    hexadecimal_character_reference_start(html, %{s | buffer: [s.buffer | [c]]})
+  end
+
+  defp do_numeric_character_reference(html, s) do
+    decimal_character_reference_start(html, s)
+  end
+
+  # § tokenizer-hexadecimal-character-reference-start-state
+
+  defp hexadecimal_character_reference_start(html = <<c, _rest::binary>>, s)
+       when is_letter(c) or is_digit(c) do
+    hexadecimal_character_reference(html, s)
+  end
+
+  defp hexadecimal_character_reference_start(html, s) do
+    # set parse error
+
+    character_reference_end(html, s)
+  end
+
+  # § tokenizer-decimal-character-reference-start-state
+
+  defp decimal_character_reference_start(html = <<c, _rest::binary>>, s) when is_digit(c) do
+    decimal_character_reference(html, s)
+  end
+
+  defp decimal_character_reference_start(html, s) do
+    # set parse error
+    character_reference_end(html, s)
+  end
+
+  # § tokenizer-hexadecimal-character-reference-state
+
+  defp hexadecimal_character_reference(<<c, html::binary>>, s) when is_digit(c) do
+    hexadecimal_character_reference(html, %{s | charref_code: s.charref_code * 16 + c - 0x30})
+  end
+
+  defp hexadecimal_character_reference(<<c, html::binary>>, s) when c in ?A..?F do
+    hexadecimal_character_reference(html, %{s | charref_code: s.charref_code * 16 + c - 0x37})
+  end
+
+  defp hexadecimal_character_reference(<<c, html::binary>>, s) when c in ?a..?f do
+    hexadecimal_character_reference(html, %{s | charref_code: s.charref_code * 16 + c - 0x57})
+  end
+
+  defp hexadecimal_character_reference(<<?;, html::binary>>, s) do
+    numeric_character_reference_end(html, s)
+  end
+
+  defp hexadecimal_character_reference(html, s) do
+    # set parse error
+    numeric_character_reference_end(html, s)
+  end
+
+  # § tokenizer-decimal-character-reference-state
+
+  defp decimal_character_reference(<<c, html::binary>>, s) when is_digit(c) do
+    decimal_character_reference(html, %{s | charref_code: s.charref_code * 10 + c - 0x30})
+  end
+
+  defp decimal_character_reference(<<?;, html::binary>>, s) do
+    numeric_character_reference_end(html, s)
+  end
+
+  defp decimal_character_reference(html, s) do
+    # set parse error
+
+    numeric_character_reference_end(html, s)
+  end
+
+  # § tokenizer-decimal-character-reference-state
+
+  defp numeric_character_reference_end(html, s) do
+    # set parse errors
+    {:ok, {_, numeric_char}} = Floki.HTML.NumericCharref.to_unicode_number(s.charref_code)
+
+    character_reference_end(html, %{s | buffer: [numeric_char]})
+  end
+
+  # § tokenizer-character-reference-end-state
+
+  @spec character_reference_end(binary(), State.t()) :: State.t()
+  defp character_reference_end(html, s) do
+    state =
+      if part_of_attr?(s) do
+        [attr | attrs] = s.token.attributes
+        new_attr = %Attribute{attr | value: [attr.value | s.buffer]}
+        new_tag = %StartTag{s.token | attributes: [new_attr | attrs]}
+
+        %{s | token: new_tag}
+      else
+        %{s | tokens: append_char_token(s, s.buffer)}
+      end
+
+    case state.return_state do
+      :data ->
+        data(html, state)
+
+      :rcdata ->
+        rcdata(html, state)
+
+      :attribute_value_unquoted ->
+        attribute_value_unquoted(html, state)
+
+      :attribute_value_single_quoted ->
+        attribute_value_single_quoted(html, state)
+
+      :attribute_value_double_quoted ->
+        attribute_value_double_quoted(html, state)
+    end
+  end
+
+  defp part_of_attr?(state) do
+    state.return_state in [
+      :attribute_value_double_quoted,
+      :attribute_value_single_quoted,
+      :attribute_value_unquoted
+    ]
+  end
+
+  defp append_char_token(state, char) do
+    case state.tokens do
+      [{:char, data} | rest] ->
+        if is_binary(char) do
+          [state.emit.({:char, [data | char]}) | rest]
+        else
+          [state.emit.({:char, [data | [char]]}) | rest]
+        end
+
+      other_tokens ->
+        if is_list(char) || is_binary(char) do
+          [state.emit.({:char, char}) | other_tokens]
+        else
+          [state.emit.({:char, [char]}) | other_tokens]
+        end
+    end
+  end
+
+  defp appropriate_tag?(state) do
+    with %StartTag{name: start_tag_name} <- state.last_start_tag,
+         %EndTag{name: end_tag_name} <- state.token do
+      IO.chardata_to_string(start_tag_name) == IO.chardata_to_string(end_tag_name)
+    else
+      _ -> false
+    end
+  end
+
+  defp tokens_for_inappropriate_end_tag(state) do
+    [
+      state.emit.({:char, state.buffer}),
+      state.emit.({:char, [@solidus]}),
+      state.emit.({:char, [@less_than_sign]}) | state.tokens
+    ]
+  end
+end
diff --git a/lib/floki/html_parser.ex b/lib/floki/html_parser.ex
index 8963d56a..55f2e1b3 100644
--- a/lib/floki/html_parser.ex
+++ b/lib/floki/html_parser.ex
@@ -3,8 +3,8 @@ defmodule Floki.HTMLParser do
   A entry point to dynamic dispatch functions to
   the configured HTML parser.
 
-  The configuration can be done with the "html_parser"
-  option when calling the functions, or for the "floki" application:
+  The configuration can be done with the `:html_parser`
+  option when calling the functions, or for the `:floki` application:
 
       Floki.parse_document(document, html_parser: Floki.HTMLParser.FastHtml)
 
@@ -33,6 +33,6 @@ defmodule Floki.HTMLParser do
   end
 
   defp parser(opts) do
-    Keyword.get(opts, :html_parser) || Application.get_env(:floki, :html_parser, @default_parser)
+    opts[:html_parser] || Application.get_env(:floki, :html_parser, @default_parser)
   end
 end
diff --git a/lib/floki/html_tree/comment.ex b/lib/floki/html_tree/comment.ex
index 24b21740..42e2e107 100644
--- a/lib/floki/html_tree/comment.ex
+++ b/lib/floki/html_tree/comment.ex
@@ -2,6 +2,7 @@ defmodule Floki.HTMLTree.Comment do
   @moduledoc false
 
   # Represents a comment inside an HTML tree with reference to its parent node id.
+  # TODO: rename content to data
   defstruct content: "", node_id: nil, parent_node_id: nil
 
   @type t :: %__MODULE__{
diff --git a/lib/floki/selector.ex b/lib/floki/selector.ex
index a3ed0cc5..0bd9476e 100644
--- a/lib/floki/selector.ex
+++ b/lib/floki/selector.ex
@@ -210,6 +210,10 @@ defmodule Floki.Selector do
     PseudoClass.match_contains?(tree, html_node, pseudo_class)
   end
 
+  defp pseudo_class_match?(html_node, %{name: "root"}, tree) do
+    PseudoClass.match_root?(html_node, tree)
+  end
+
   defp pseudo_class_match?(_html_node, %{name: unknown_pseudo_class}, _tree) do
     Logger.info(fn ->
       "Pseudo-class #{inspect(unknown_pseudo_class)} is not implemented. Ignoring."
diff --git a/lib/floki/selector/attribute_selector.ex b/lib/floki/selector/attribute_selector.ex
index 6174025c..4abbf8da 100644
--- a/lib/floki/selector/attribute_selector.ex
+++ b/lib/floki/selector/attribute_selector.ex
@@ -6,17 +6,18 @@ defmodule Floki.Selector.AttributeSelector do
 
   alias Floki.Selector.AttributeSelector
 
-  defstruct match_type: nil, attribute: nil, value: nil
+  defstruct match_type: nil, attribute: nil, value: nil, flag: nil
 
   @type t :: %__MODULE__{
           match_type: :atom | nil,
           attribute: String.t(),
-          value: String.t() | nil
+          value: String.t() | nil,
+          flag: String.t() | nil
         }
 
   defimpl String.Chars do
     def to_string(selector) do
-      "[#{selector.attribute}#{type(selector.match_type)}'#{selector.value}']"
+      "[#{selector.attribute}#{type(selector.match_type)}'#{selector.value}'#{flag(selector.flag)}]"
     end
 
     defp type(match_type) do
@@ -30,6 +31,9 @@ defmodule Floki.Selector.AttributeSelector do
         _ -> ""
       end
     end
+
+    defp flag(nil), do: ""
+    defp flag(flag), do: " " <> flag
   end
 
   # Returns if attributes of a node matches with a given attribute selector.
@@ -37,6 +41,51 @@ defmodule Floki.Selector.AttributeSelector do
     attribute_present?(s.attribute, attributes)
   end
 
+  # Case-insensitive matches
+
+  def match?(attributes, s = %AttributeSelector{match_type: :equal, flag: "i"}) do
+    String.downcase(get_value(s.attribute, attributes)) == String.downcase(s.value)
+  end
+
+  def match?(attributes, s = %AttributeSelector{match_type: :includes, flag: "i"}) do
+    selector_value = String.downcase(s.value)
+    value = String.downcase(get_value(s.attribute, attributes))
+
+    whitespace_values = String.split(value, ~r/\s+/)
+
+    Enum.any?(whitespace_values, fn v -> v == selector_value end)
+  end
+
+  def match?(attributes, s = %AttributeSelector{match_type: :dash_match, flag: "i"}) do
+    selector_value = String.downcase(s.value)
+    value = String.downcase(get_value(s.attribute, attributes))
+
+    value == selector_value || String.starts_with?(value, "#{selector_value}-")
+  end
+
+  def match?(attributes, s = %AttributeSelector{match_type: :prefix_match, flag: "i"}) do
+    s.attribute
+    |> get_value(attributes)
+    |> String.downcase()
+    |> String.starts_with?(String.downcase(s.value))
+  end
+
+  def match?(attributes, s = %AttributeSelector{match_type: :sufix_match, flag: "i"}) do
+    s.attribute
+    |> get_value(attributes)
+    |> String.downcase()
+    |> String.ends_with?(String.downcase(s.value))
+  end
+
+  def match?(attributes, s = %AttributeSelector{match_type: :substring_match, flag: "i"}) do
+    s.attribute
+    |> get_value(attributes)
+    |> String.downcase()
+    |> String.contains?(String.downcase(s.value))
+  end
+
+  # Case-sensitive matches
+
   def match?(attributes, s = %AttributeSelector{match_type: :equal}) do
     get_value(s.attribute, attributes) == s.value
   end
diff --git a/lib/floki/selector/parser.ex b/lib/floki/selector/parser.ex
index 453c6f64..ffd038ec 100644
--- a/lib/floki/selector/parser.ex
+++ b/lib/floki/selector/parser.ex
@@ -54,7 +54,7 @@ defmodule Floki.Selector.Parser do
   end
 
   defp do_parse([{:hash, _, id} | t], selector) do
-    do_parse(t, %{selector | id: to_string(id)})
+    do_parse(t, %{selector | id: to_string(id) |> String.replace("\\.", ".")})
   end
 
   defp do_parse([{:class, _, class} | t], selector) do
@@ -168,6 +168,12 @@ defmodule Floki.Selector.Parser do
     consume_attribute(:consuming, t, new_selector)
   end
 
+  defp consume_attribute(:consuming, [{:attribute_identifier, _, value} | t], attr_selector) do
+    flag = String.at(to_string(value), -2)
+    new_selector = %{attr_selector | flag: flag}
+    consume_attribute(:done, t, new_selector)
+  end
+
   defp consume_attribute(:consuming, [{']', _} | t], attr_selector) do
     consume_attribute(:done, t, attr_selector)
   end
diff --git a/lib/floki/selector/pseudo_class.ex b/lib/floki/selector/pseudo_class.ex
index 18c0fd8c..ed48b5c9 100644
--- a/lib/floki/selector/pseudo_class.ex
+++ b/lib/floki/selector/pseudo_class.ex
@@ -144,6 +144,10 @@ defmodule Floki.Selector.PseudoClass do
     false
   end
 
+  def match_root?(html_node, tree) do
+    html_node.node_id in tree.root_nodes_ids
+  end
+
   defp node_position(ids, %HTMLNode{node_id: node_id}) do
     {_node_id, position} = Enum.find(ids, fn {id, _} -> id == node_id end)
 
diff --git a/lib/mix/tasks/generate_entities.ex b/lib/mix/tasks/generate_entities.ex
new file mode 100644
index 00000000..32dc6989
--- /dev/null
+++ b/lib/mix/tasks/generate_entities.ex
@@ -0,0 +1,57 @@
+defmodule Mix.Tasks.GenerateEntities do
+  @shortdoc "Generate the entities module"
+
+  @json_entities_path "priv/entities.json"
+  @destination_module_path "lib/floki/entities.ex"
+
+  use Mix.Task
+
+  @impl Mix.Task
+  def run(_) do
+    Mix.shell().info("Generating entities..")
+
+    {:ok, content} = File.read(@json_entities_path)
+    {:ok, json} = Jason.decode(content)
+
+    headers = """
+    defmodule Floki.Entities do
+    # This file was generated by "Mix.Tasks.GenerateEntities"
+
+    @moduledoc false
+
+    @doc \"\"\"
+    Returns unicode codepoints for a given HTML entity.
+    \"\"\"
+    @spec get(binary()) :: list(integer)
+    """
+
+    fun_template = fn {key, value} ->
+      [
+        "def get(",
+        inspect(key),
+        "), do: ",
+        inspect(Map.fetch!(value, "codepoints"), charlists: :as_lists),
+        "\n"
+      ]
+    end
+
+    functions =
+      json
+      |> Enum.sort_by(fn {key, _value} -> key end)
+      |> Enum.map(fun_template)
+
+    bottom = """
+      def get(_), do: []
+    end
+    """
+
+    contents =
+      [headers, functions, bottom]
+      |> IO.iodata_to_binary()
+      |> Code.format_string!()
+
+    File.write!(@destination_module_path, contents)
+
+    Mix.shell().info("Entities module is located in lib/floki/entities.ex")
+  end
+end
diff --git a/lib/mix/tasks/generate_tokenizer_tests.ex b/lib/mix/tasks/generate_tokenizer_tests.ex
new file mode 100644
index 00000000..3ec263f7
--- /dev/null
+++ b/lib/mix/tasks/generate_tokenizer_tests.ex
@@ -0,0 +1,79 @@
+defmodule Mix.Tasks.GenerateTokenizerTests do
+  @moduledoc """
+  It generates tests based on test files from WHATWG.
+
+  This task will take a look at tokenizer test files
+  that are located in "./test/html5lib-tests/tokenizer"
+  and generate modules to run those tests.
+
+  This is necessary every time the specs of HTML change,
+  so we can keep up to date and also we can keep track
+  of what changed.
+  """
+
+  @shortdoc "Generate tokenizer tests based on specs."
+
+  @base_path "test/html5lib-tests/tokenizer"
+  @html5lib_revision_path ".git/modules/test/html5lib-tests/HEAD"
+  @template_path "priv/tokenizer_test_template.ex.eex"
+  @destination_path "test/floki/html/generated/tokenizer"
+
+  use Mix.Task
+
+  @impl Mix.Task
+  def run([filename | _]) do
+    Mix.shell().info("generating #{filename}...")
+
+    {:ok, content} = File.read(Path.join([@base_path, filename]))
+    {:ok, json} = Jason.decode(content)
+
+    identity_fun = fn %{"description" => desc} -> desc end
+    revision = File.read!(@html5lib_revision_path)
+
+    tests =
+      Map.fetch!(json, "tests")
+      |> Enum.filter(fn %{"description" => desc} ->
+        is_binary(desc) && desc != ""
+      end)
+      |> Enum.uniq_by(identity_fun)
+      |> Enum.sort_by(identity_fun)
+
+    basename = String.split(filename, ".") |> List.first()
+
+    if length(tests) <= 100 do
+      save_tests(basename, filename, tests, revision)
+    else
+      tests
+      |> Enum.chunk_every(100)
+      |> Enum.with_index(1)
+      |> Enum.each(fn {tests_group, idx} ->
+        save_tests(basename <> "_part#{idx}", filename, tests_group, revision)
+      end)
+    end
+  end
+
+  defp save_tests(basename, filename, tests, revision) do
+    test_name =
+      basename
+      |> String.split("_")
+      |> Enum.map_join(&String.capitalize(&1))
+
+    destination_path = Path.join([@destination_path, basename <> "_test.exs"])
+
+    contents =
+      @template_path
+      |> EEx.eval_file(
+        tests: tests,
+        test_name: test_name,
+        test_file: filename,
+        revision: revision
+      )
+      |> Code.format_string!()
+
+    Mix.shell().info(contents)
+
+    File.write!(destination_path, contents)
+
+    Mix.shell().info("saved in #{destination_path}.")
+  end
+end
diff --git a/mix.exs b/mix.exs
index e3177880..7d2b2d0f 100644
--- a/mix.exs
+++ b/mix.exs
@@ -3,7 +3,7 @@ defmodule Floki.Mixfile do
 
   @description "Floki is a simple HTML parser that enables search for nodes using CSS selectors."
   @source_url "https://github.com/philss/floki"
-  @version "0.31.0"
+  @version "0.32.0"
 
   def project do
     [
@@ -19,7 +19,8 @@ defmodule Floki.Mixfile do
       docs: docs(),
       dialyzer: [
         plt_file: {:no_warn, "priv/plts/dialyzer.plt"}
-      ]
+      ],
+      elixirc_paths: elixirc_paths(Mix.env())
     ]
   end
 
@@ -56,12 +57,12 @@ defmodule Floki.Mixfile do
 
     [
       {:html_entities, "~> 0.5.0"},
+      {:jason, "~> 1.1", only: [:dev, :test, :docs]},
       {:earmark, "~> 1.2", only: :dev},
-      {:ex_doc, "~> 0.24.1", only: :dev, runtime: false},
+      {:ex_doc, "~> 0.25.0", only: :dev, runtime: false},
       {:benchee, "~> 1.0.1", only: :dev},
       {:credo, ">= 0.0.0", only: [:dev, :test]},
-      {:dialyxir, "~> 1.0", only: [:dev], runtime: false},
-      {:inch_ex, "~> 2.1.0-rc.1", only: :docs}
+      {:dialyxir, "~> 1.0", only: [:dev], runtime: false}
     ] ++ parsers
   end
 
@@ -104,7 +105,9 @@ defmodule Floki.Mixfile do
       maintainers: ["Philip Sampaio Silva"],
       licenses: ["MIT"],
       files: [
-        "lib",
+        # We don't want to ship mix tasks.
+        "lib/floki",
+        "lib/floki.ex",
         "src/*.xrl",
         "src/floki_mochi_html.erl",
         "src/floki.gleam",
@@ -122,4 +125,8 @@ defmodule Floki.Mixfile do
       }
     }
   end
+
+  # Specifies which paths to compile per environment.
+  defp elixirc_paths(:test), do: ["test/support", "lib"]
+  defp elixirc_paths(_), do: ["lib"]
 end
diff --git a/mix.lock b/mix.lock
index 4ac82db9..0f84d274 100644
--- a/mix.lock
+++ b/mix.lock
@@ -4,22 +4,21 @@
   "credo": {:hex, :credo, "1.5.6", "e04cc0fdc236fefbb578e0c04bd01a471081616e741d386909e527ac146016c6", [:mix], [{:bunt, "~> 0.2.0", [hex: :bunt, repo: "hexpm", optional: false]}, {:file_system, "~> 0.2.8", [hex: :file_system, repo: "hexpm", optional: false]}, {:jason, "~> 1.0", [hex: :jason, repo: "hexpm", optional: false]}], "hexpm", "4b52a3e558bd64e30de62a648518a5ea2b6e3e5d2b164ef5296244753fc7eb17"},
   "deep_merge": {:hex, :deep_merge, "1.0.0", "b4aa1a0d1acac393bdf38b2291af38cb1d4a52806cf7a4906f718e1feb5ee961", [:mix], [], "hexpm", "ce708e5f094b9cd4e8f2be4f00d2f4250c4095be93f8cd6d018c753894885430"},
   "dialyxir": {:hex, :dialyxir, "1.1.0", "c5aab0d6e71e5522e77beff7ba9e08f8e02bad90dfbeffae60eaf0cb47e29488", [:mix], [{:erlex, ">= 0.2.6", [hex: :erlex, repo: "hexpm", optional: false]}], "hexpm", "07ea8e49c45f15264ebe6d5b93799d4dd56a44036cf42d0ad9c960bc266c0b9a"},
-  "earmark": {:hex, :earmark, "1.4.15", "2c7f924bf495ec1f65bd144b355d0949a05a254d0ec561740308a54946a67888", [:mix], [{:earmark_parser, ">= 1.4.13", [hex: :earmark_parser, repo: "hexpm", optional: false]}], "hexpm", "3b1209b85bc9f3586f370f7c363f6533788fb4e51db23aa79565875e7f9999ee"},
-  "earmark_parser": {:hex, :earmark_parser, "1.4.13", "0c98163e7d04a15feb62000e1a891489feb29f3d10cb57d4f845c405852bbef8", [:mix], [], "hexpm", "d602c26af3a0af43d2f2645613f65841657ad6efc9f0e361c3b6c06b578214ba"},
+  "earmark": {:hex, :earmark, "1.4.16", "2188754e590a3c379fdd2783bb44eedd8c54968fa0256b6f336f6d56b089d793", [:mix], [{:earmark_parser, ">= 1.4.16", [hex: :earmark_parser, repo: "hexpm", optional: false]}], "hexpm", "46f853f7ae10bee06923430dca522ba9dcbdc6b7a9729748e8dd5344d21b8418"},
+  "earmark_parser": {:hex, :earmark_parser, "1.4.16", "607709303e1d4e3e02f1444df0c821529af1c03b8578dfc81bb9cf64553d02b9", [:mix], [], "hexpm", "69fcf696168f5a274dd012e3e305027010658b2d1630cef68421d6baaeaccead"},
   "elixir_make": {:hex, :elixir_make, "0.6.2", "7dffacd77dec4c37b39af867cedaabb0b59f6a871f89722c25b28fcd4bd70530", [:mix], [], "hexpm", "03e49eadda22526a7e5279d53321d1cced6552f344ba4e03e619063de75348d9"},
   "erlex": {:hex, :erlex, "0.2.6", "c7987d15e899c7a2f34f5420d2a2ea0d659682c06ac607572df55a43753aa12e", [:mix], [], "hexpm", "2ed2e25711feb44d52b17d2780eabf998452f6efda104877a3881c2f8c0c0c75"},
-  "ex_doc": {:hex, :ex_doc, "0.24.2", "e4c26603830c1a2286dae45f4412a4d1980e1e89dc779fcd0181ed1d5a05c8d9", [:mix], [{:earmark_parser, "~> 1.4.0", [hex: :earmark_parser, repo: "hexpm", optional: false]}, {:makeup_elixir, "~> 0.14", [hex: :makeup_elixir, repo: "hexpm", optional: false]}, {:makeup_erlang, "~> 0.1", [hex: :makeup_erlang, repo: "hexpm", optional: false]}], "hexpm", "e134e1d9e821b8d9e4244687fb2ace58d479b67b282de5158333b0d57c6fb7da"},
+  "ex_doc": {:hex, :ex_doc, "0.25.3", "3edf6a0d70a39d2eafde030b8895501b1c93692effcbd21347296c18e47618ce", [:mix], [{:earmark_parser, "~> 1.4.0", [hex: :earmark_parser, repo: "hexpm", optional: false]}, {:makeup_elixir, "~> 0.14", [hex: :makeup_elixir, repo: "hexpm", optional: false]}, {:makeup_erlang, "~> 0.1", [hex: :makeup_erlang, repo: "hexpm", optional: false]}], "hexpm", "9ebebc2169ec732a38e9e779fd0418c9189b3ca93f4a676c961be6c1527913f5"},
   "fast_html": {:hex, :fast_html, "2.0.4", "4910ee49f2f6b19692e3bf30bf97f1b6b7dac489cd6b0f34cd0fe3042c56ba30", [:make, :mix], [{:elixir_make, "~> 0.4", [hex: :elixir_make, repo: "hexpm", optional: false]}, {:nimble_pool, "~> 0.1.0", [hex: :nimble_pool, repo: "hexpm", optional: false]}], "hexpm", "3bb49d541dfc02ad5e425904f53376d758c09f89e521afc7d2b174b3227761ea"},
   "file_system": {:hex, :file_system, "0.2.10", "fb082005a9cd1711c05b5248710f8826b02d7d1784e7c3451f9c1231d4fc162d", [:mix], [], "hexpm", "41195edbfb562a593726eda3b3e8b103a309b733ad25f3d642ba49696bf715dc"},
-  "html5ever": {:hex, :html5ever, "0.8.0", "2114c27c28dbb0fc6a8e3936cfb7ca3ea12edc722f865cde4702ba9da4ed3f1c", [:mix], [{:rustler, "~> 0.21.0", [hex: :rustler, repo: "hexpm", optional: false]}], "hexpm", "4c50ac60a9dca114c359f657aca063cbc2970cdd572aa5e202b1368c2ecdb45a"},
+  "html5ever": {:hex, :html5ever, "0.9.0", "8f51ff9222a95494f33477c44fd2a9132d1dba82bb452a04343a14e7e9920f1d", [:mix], [{:rustler, "~> 0.22.0", [hex: :rustler, repo: "hexpm", optional: false]}], "hexpm", "f3ca7ab856a75262a82acb4a49fc1e1078979efa2e33786ebade1860f9238e2d"},
   "html_entities": {:hex, :html_entities, "0.5.2", "9e47e70598da7de2a9ff6af8758399251db6dbb7eebe2b013f2bbd2515895c3c", [:mix], [], "hexpm", "c53ba390403485615623b9531e97696f076ed415e8d8058b1dbaa28181f4fdcc"},
-  "inch_ex": {:hex, :inch_ex, "2.1.0-rc.1", "7642a8902c0d2ed5d9b5754b2fc88fedf630500d630fc03db7caca2e92dedb36", [:mix], [{:bunt, "~> 0.2", [hex: :bunt, repo: "hexpm", optional: false]}, {:jason, "~> 1.0", [hex: :jason, repo: "hexpm", optional: false]}], "hexpm", "4ceee988760f9382d1c1d0b93ea5875727f6071693e89a0a3c49c456ef1be75d"},
   "jason": {:hex, :jason, "1.2.2", "ba43e3f2709fd1aa1dce90aaabfd039d000469c05c56f0b8e31978e03fa39052", [:mix], [{:decimal, "~> 1.0 or ~> 2.0", [hex: :decimal, repo: "hexpm", optional: true]}], "hexpm", "18a228f5f0058ee183f29f9eae0805c6e59d61c3b006760668d8d18ff0d12179"},
   "makeup": {:hex, :makeup, "1.0.5", "d5a830bc42c9800ce07dd97fa94669dfb93d3bf5fcf6ea7a0c67b2e0e4a7f26c", [:mix], [{:nimble_parsec, "~> 0.5 or ~> 1.0", [hex: :nimble_parsec, repo: "hexpm", optional: false]}], "hexpm", "cfa158c02d3f5c0c665d0af11512fed3fba0144cf1aadee0f2ce17747fba2ca9"},
   "makeup_elixir": {:hex, :makeup_elixir, "0.15.1", "b5888c880d17d1cc3e598f05cdb5b5a91b7b17ac4eaf5f297cb697663a1094dd", [:mix], [{:makeup, "~> 1.0", [hex: :makeup, repo: "hexpm", optional: false]}, {:nimble_parsec, "~> 1.1", [hex: :nimble_parsec, repo: "hexpm", optional: false]}], "hexpm", "db68c173234b07ab2a07f645a5acdc117b9f99d69ebf521821d89690ae6c6ec8"},
   "makeup_erlang": {:hex, :makeup_erlang, "0.1.1", "3fcb7f09eb9d98dc4d208f49cc955a34218fc41ff6b84df7c75b3e6e533cc65f", [:mix], [{:makeup, "~> 1.0", [hex: :makeup, repo: "hexpm", optional: false]}], "hexpm", "174d0809e98a4ef0b3309256cbf97101c6ec01c4ab0b23e926a9e17df2077cbb"},
   "nimble_parsec": {:hex, :nimble_parsec, "1.1.0", "3a6fca1550363552e54c216debb6a9e95bd8d32348938e13de5eda962c0d7f89", [:mix], [], "hexpm", "08eb32d66b706e913ff748f11694b17981c0b04a33ef470e33e11b3d3ac8f54b"},
   "nimble_pool": {:hex, :nimble_pool, "0.1.0", "ffa9d5be27eee2b00b0c634eb649aa27f97b39186fec3c493716c2a33e784ec6", [:mix], [], "hexpm", "343a1eaa620ddcf3430a83f39f2af499fe2370390d4f785cd475b4df5acaf3f9"},
-  "rustler": {:hex, :rustler, "0.21.1", "5299980be32da997c54382e945bacaa015ed97a60745e1e639beaf6a7b278c65", [:mix], [{:toml, "~> 0.5.2", [hex: :toml, repo: "hexpm", optional: false]}], "hexpm", "6ee1651e10645b2b2f3bb70502bf180341aa058709177e9bc28c105934094bc6"},
+  "rustler": {:hex, :rustler, "0.22.1", "0bc4806f8352a4aeb7f209a41cddca8454d8627bb11704b083371f794a1bfd00", [:mix], [{:jason, "~> 1.2", [hex: :jason, repo: "hexpm", optional: false]}, {:toml, "~> 0.5.2", [hex: :toml, repo: "hexpm", optional: false]}], "hexpm", "ebb7a65b616e631c40309990b13bd29e91876a25c6fe8e0afcf1a3a0eab22bf1"},
   "toml": {:hex, :toml, "0.5.2", "e471388a8726d1ce51a6b32f864b8228a1eb8edc907a0edf2bb50eab9321b526", [:mix], [], "hexpm", "f1e3dabef71fb510d015fad18c0e05e7c57281001141504c6b69d94e99750a07"},
 }
diff --git a/priv/entities.json b/priv/entities.json
new file mode 100644
index 00000000..8a1f590a
--- /dev/null
+++ b/priv/entities.json
@@ -0,0 +1,2233 @@
+{
+  "&Aacute;": { "codepoints": [193], "characters": "\u00C1" },
+  "&Aacute": { "codepoints": [193], "characters": "\u00C1" },
+  "&aacute;": { "codepoints": [225], "characters": "\u00E1" },
+  "&aacute": { "codepoints": [225], "characters": "\u00E1" },
+  "&Abreve;": { "codepoints": [258], "characters": "\u0102" },
+  "&abreve;": { "codepoints": [259], "characters": "\u0103" },
+  "&ac;": { "codepoints": [8766], "characters": "\u223E" },
+  "&acd;": { "codepoints": [8767], "characters": "\u223F" },
+  "&acE;": { "codepoints": [8766, 819], "characters": "\u223E\u0333" },
+  "&Acirc;": { "codepoints": [194], "characters": "\u00C2" },
+  "&Acirc": { "codepoints": [194], "characters": "\u00C2" },
+  "&acirc;": { "codepoints": [226], "characters": "\u00E2" },
+  "&acirc": { "codepoints": [226], "characters": "\u00E2" },
+  "&acute;": { "codepoints": [180], "characters": "\u00B4" },
+  "&acute": { "codepoints": [180], "characters": "\u00B4" },
+  "&Acy;": { "codepoints": [1040], "characters": "\u0410" },
+  "&acy;": { "codepoints": [1072], "characters": "\u0430" },
+  "&AElig;": { "codepoints": [198], "characters": "\u00C6" },
+  "&AElig": { "codepoints": [198], "characters": "\u00C6" },
+  "&aelig;": { "codepoints": [230], "characters": "\u00E6" },
+  "&aelig": { "codepoints": [230], "characters": "\u00E6" },
+  "&af;": { "codepoints": [8289], "characters": "\u2061" },
+  "&Afr;": { "codepoints": [120068], "characters": "\uD835\uDD04" },
+  "&afr;": { "codepoints": [120094], "characters": "\uD835\uDD1E" },
+  "&Agrave;": { "codepoints": [192], "characters": "\u00C0" },
+  "&Agrave": { "codepoints": [192], "characters": "\u00C0" },
+  "&agrave;": { "codepoints": [224], "characters": "\u00E0" },
+  "&agrave": { "codepoints": [224], "characters": "\u00E0" },
+  "&alefsym;": { "codepoints": [8501], "characters": "\u2135" },
+  "&aleph;": { "codepoints": [8501], "characters": "\u2135" },
+  "&Alpha;": { "codepoints": [913], "characters": "\u0391" },
+  "&alpha;": { "codepoints": [945], "characters": "\u03B1" },
+  "&Amacr;": { "codepoints": [256], "characters": "\u0100" },
+  "&amacr;": { "codepoints": [257], "characters": "\u0101" },
+  "&amalg;": { "codepoints": [10815], "characters": "\u2A3F" },
+  "&amp;": { "codepoints": [38], "characters": "\u0026" },
+  "&amp": { "codepoints": [38], "characters": "\u0026" },
+  "&AMP;": { "codepoints": [38], "characters": "\u0026" },
+  "&AMP": { "codepoints": [38], "characters": "\u0026" },
+  "&andand;": { "codepoints": [10837], "characters": "\u2A55" },
+  "&And;": { "codepoints": [10835], "characters": "\u2A53" },
+  "&and;": { "codepoints": [8743], "characters": "\u2227" },
+  "&andd;": { "codepoints": [10844], "characters": "\u2A5C" },
+  "&andslope;": { "codepoints": [10840], "characters": "\u2A58" },
+  "&andv;": { "codepoints": [10842], "characters": "\u2A5A" },
+  "&ang;": { "codepoints": [8736], "characters": "\u2220" },
+  "&ange;": { "codepoints": [10660], "characters": "\u29A4" },
+  "&angle;": { "codepoints": [8736], "characters": "\u2220" },
+  "&angmsdaa;": { "codepoints": [10664], "characters": "\u29A8" },
+  "&angmsdab;": { "codepoints": [10665], "characters": "\u29A9" },
+  "&angmsdac;": { "codepoints": [10666], "characters": "\u29AA" },
+  "&angmsdad;": { "codepoints": [10667], "characters": "\u29AB" },
+  "&angmsdae;": { "codepoints": [10668], "characters": "\u29AC" },
+  "&angmsdaf;": { "codepoints": [10669], "characters": "\u29AD" },
+  "&angmsdag;": { "codepoints": [10670], "characters": "\u29AE" },
+  "&angmsdah;": { "codepoints": [10671], "characters": "\u29AF" },
+  "&angmsd;": { "codepoints": [8737], "characters": "\u2221" },
+  "&angrt;": { "codepoints": [8735], "characters": "\u221F" },
+  "&angrtvb;": { "codepoints": [8894], "characters": "\u22BE" },
+  "&angrtvbd;": { "codepoints": [10653], "characters": "\u299D" },
+  "&angsph;": { "codepoints": [8738], "characters": "\u2222" },
+  "&angst;": { "codepoints": [197], "characters": "\u00C5" },
+  "&angzarr;": { "codepoints": [9084], "characters": "\u237C" },
+  "&Aogon;": { "codepoints": [260], "characters": "\u0104" },
+  "&aogon;": { "codepoints": [261], "characters": "\u0105" },
+  "&Aopf;": { "codepoints": [120120], "characters": "\uD835\uDD38" },
+  "&aopf;": { "codepoints": [120146], "characters": "\uD835\uDD52" },
+  "&apacir;": { "codepoints": [10863], "characters": "\u2A6F" },
+  "&ap;": { "codepoints": [8776], "characters": "\u2248" },
+  "&apE;": { "codepoints": [10864], "characters": "\u2A70" },
+  "&ape;": { "codepoints": [8778], "characters": "\u224A" },
+  "&apid;": { "codepoints": [8779], "characters": "\u224B" },
+  "&apos;": { "codepoints": [39], "characters": "\u0027" },
+  "&ApplyFunction;": { "codepoints": [8289], "characters": "\u2061" },
+  "&approx;": { "codepoints": [8776], "characters": "\u2248" },
+  "&approxeq;": { "codepoints": [8778], "characters": "\u224A" },
+  "&Aring;": { "codepoints": [197], "characters": "\u00C5" },
+  "&Aring": { "codepoints": [197], "characters": "\u00C5" },
+  "&aring;": { "codepoints": [229], "characters": "\u00E5" },
+  "&aring": { "codepoints": [229], "characters": "\u00E5" },
+  "&Ascr;": { "codepoints": [119964], "characters": "\uD835\uDC9C" },
+  "&ascr;": { "codepoints": [119990], "characters": "\uD835\uDCB6" },
+  "&Assign;": { "codepoints": [8788], "characters": "\u2254" },
+  "&ast;": { "codepoints": [42], "characters": "\u002A" },
+  "&asymp;": { "codepoints": [8776], "characters": "\u2248" },
+  "&asympeq;": { "codepoints": [8781], "characters": "\u224D" },
+  "&Atilde;": { "codepoints": [195], "characters": "\u00C3" },
+  "&Atilde": { "codepoints": [195], "characters": "\u00C3" },
+  "&atilde;": { "codepoints": [227], "characters": "\u00E3" },
+  "&atilde": { "codepoints": [227], "characters": "\u00E3" },
+  "&Auml;": { "codepoints": [196], "characters": "\u00C4" },
+  "&Auml": { "codepoints": [196], "characters": "\u00C4" },
+  "&auml;": { "codepoints": [228], "characters": "\u00E4" },
+  "&auml": { "codepoints": [228], "characters": "\u00E4" },
+  "&awconint;": { "codepoints": [8755], "characters": "\u2233" },
+  "&awint;": { "codepoints": [10769], "characters": "\u2A11" },
+  "&backcong;": { "codepoints": [8780], "characters": "\u224C" },
+  "&backepsilon;": { "codepoints": [1014], "characters": "\u03F6" },
+  "&backprime;": { "codepoints": [8245], "characters": "\u2035" },
+  "&backsim;": { "codepoints": [8765], "characters": "\u223D" },
+  "&backsimeq;": { "codepoints": [8909], "characters": "\u22CD" },
+  "&Backslash;": { "codepoints": [8726], "characters": "\u2216" },
+  "&Barv;": { "codepoints": [10983], "characters": "\u2AE7" },
+  "&barvee;": { "codepoints": [8893], "characters": "\u22BD" },
+  "&barwed;": { "codepoints": [8965], "characters": "\u2305" },
+  "&Barwed;": { "codepoints": [8966], "characters": "\u2306" },
+  "&barwedge;": { "codepoints": [8965], "characters": "\u2305" },
+  "&bbrk;": { "codepoints": [9141], "characters": "\u23B5" },
+  "&bbrktbrk;": { "codepoints": [9142], "characters": "\u23B6" },
+  "&bcong;": { "codepoints": [8780], "characters": "\u224C" },
+  "&Bcy;": { "codepoints": [1041], "characters": "\u0411" },
+  "&bcy;": { "codepoints": [1073], "characters": "\u0431" },
+  "&bdquo;": { "codepoints": [8222], "characters": "\u201E" },
+  "&becaus;": { "codepoints": [8757], "characters": "\u2235" },
+  "&because;": { "codepoints": [8757], "characters": "\u2235" },
+  "&Because;": { "codepoints": [8757], "characters": "\u2235" },
+  "&bemptyv;": { "codepoints": [10672], "characters": "\u29B0" },
+  "&bepsi;": { "codepoints": [1014], "characters": "\u03F6" },
+  "&bernou;": { "codepoints": [8492], "characters": "\u212C" },
+  "&Bernoullis;": { "codepoints": [8492], "characters": "\u212C" },
+  "&Beta;": { "codepoints": [914], "characters": "\u0392" },
+  "&beta;": { "codepoints": [946], "characters": "\u03B2" },
+  "&beth;": { "codepoints": [8502], "characters": "\u2136" },
+  "&between;": { "codepoints": [8812], "characters": "\u226C" },
+  "&Bfr;": { "codepoints": [120069], "characters": "\uD835\uDD05" },
+  "&bfr;": { "codepoints": [120095], "characters": "\uD835\uDD1F" },
+  "&bigcap;": { "codepoints": [8898], "characters": "\u22C2" },
+  "&bigcirc;": { "codepoints": [9711], "characters": "\u25EF" },
+  "&bigcup;": { "codepoints": [8899], "characters": "\u22C3" },
+  "&bigodot;": { "codepoints": [10752], "characters": "\u2A00" },
+  "&bigoplus;": { "codepoints": [10753], "characters": "\u2A01" },
+  "&bigotimes;": { "codepoints": [10754], "characters": "\u2A02" },
+  "&bigsqcup;": { "codepoints": [10758], "characters": "\u2A06" },
+  "&bigstar;": { "codepoints": [9733], "characters": "\u2605" },
+  "&bigtriangledown;": { "codepoints": [9661], "characters": "\u25BD" },
+  "&bigtriangleup;": { "codepoints": [9651], "characters": "\u25B3" },
+  "&biguplus;": { "codepoints": [10756], "characters": "\u2A04" },
+  "&bigvee;": { "codepoints": [8897], "characters": "\u22C1" },
+  "&bigwedge;": { "codepoints": [8896], "characters": "\u22C0" },
+  "&bkarow;": { "codepoints": [10509], "characters": "\u290D" },
+  "&blacklozenge;": { "codepoints": [10731], "characters": "\u29EB" },
+  "&blacksquare;": { "codepoints": [9642], "characters": "\u25AA" },
+  "&blacktriangle;": { "codepoints": [9652], "characters": "\u25B4" },
+  "&blacktriangledown;": { "codepoints": [9662], "characters": "\u25BE" },
+  "&blacktriangleleft;": { "codepoints": [9666], "characters": "\u25C2" },
+  "&blacktriangleright;": { "codepoints": [9656], "characters": "\u25B8" },
+  "&blank;": { "codepoints": [9251], "characters": "\u2423" },
+  "&blk12;": { "codepoints": [9618], "characters": "\u2592" },
+  "&blk14;": { "codepoints": [9617], "characters": "\u2591" },
+  "&blk34;": { "codepoints": [9619], "characters": "\u2593" },
+  "&block;": { "codepoints": [9608], "characters": "\u2588" },
+  "&bne;": { "codepoints": [61, 8421], "characters": "\u003D\u20E5" },
+  "&bnequiv;": { "codepoints": [8801, 8421], "characters": "\u2261\u20E5" },
+  "&bNot;": { "codepoints": [10989], "characters": "\u2AED" },
+  "&bnot;": { "codepoints": [8976], "characters": "\u2310" },
+  "&Bopf;": { "codepoints": [120121], "characters": "\uD835\uDD39" },
+  "&bopf;": { "codepoints": [120147], "characters": "\uD835\uDD53" },
+  "&bot;": { "codepoints": [8869], "characters": "\u22A5" },
+  "&bottom;": { "codepoints": [8869], "characters": "\u22A5" },
+  "&bowtie;": { "codepoints": [8904], "characters": "\u22C8" },
+  "&boxbox;": { "codepoints": [10697], "characters": "\u29C9" },
+  "&boxdl;": { "codepoints": [9488], "characters": "\u2510" },
+  "&boxdL;": { "codepoints": [9557], "characters": "\u2555" },
+  "&boxDl;": { "codepoints": [9558], "characters": "\u2556" },
+  "&boxDL;": { "codepoints": [9559], "characters": "\u2557" },
+  "&boxdr;": { "codepoints": [9484], "characters": "\u250C" },
+  "&boxdR;": { "codepoints": [9554], "characters": "\u2552" },
+  "&boxDr;": { "codepoints": [9555], "characters": "\u2553" },
+  "&boxDR;": { "codepoints": [9556], "characters": "\u2554" },
+  "&boxh;": { "codepoints": [9472], "characters": "\u2500" },
+  "&boxH;": { "codepoints": [9552], "characters": "\u2550" },
+  "&boxhd;": { "codepoints": [9516], "characters": "\u252C" },
+  "&boxHd;": { "codepoints": [9572], "characters": "\u2564" },
+  "&boxhD;": { "codepoints": [9573], "characters": "\u2565" },
+  "&boxHD;": { "codepoints": [9574], "characters": "\u2566" },
+  "&boxhu;": { "codepoints": [9524], "characters": "\u2534" },
+  "&boxHu;": { "codepoints": [9575], "characters": "\u2567" },
+  "&boxhU;": { "codepoints": [9576], "characters": "\u2568" },
+  "&boxHU;": { "codepoints": [9577], "characters": "\u2569" },
+  "&boxminus;": { "codepoints": [8863], "characters": "\u229F" },
+  "&boxplus;": { "codepoints": [8862], "characters": "\u229E" },
+  "&boxtimes;": { "codepoints": [8864], "characters": "\u22A0" },
+  "&boxul;": { "codepoints": [9496], "characters": "\u2518" },
+  "&boxuL;": { "codepoints": [9563], "characters": "\u255B" },
+  "&boxUl;": { "codepoints": [9564], "characters": "\u255C" },
+  "&boxUL;": { "codepoints": [9565], "characters": "\u255D" },
+  "&boxur;": { "codepoints": [9492], "characters": "\u2514" },
+  "&boxuR;": { "codepoints": [9560], "characters": "\u2558" },
+  "&boxUr;": { "codepoints": [9561], "characters": "\u2559" },
+  "&boxUR;": { "codepoints": [9562], "characters": "\u255A" },
+  "&boxv;": { "codepoints": [9474], "characters": "\u2502" },
+  "&boxV;": { "codepoints": [9553], "characters": "\u2551" },
+  "&boxvh;": { "codepoints": [9532], "characters": "\u253C" },
+  "&boxvH;": { "codepoints": [9578], "characters": "\u256A" },
+  "&boxVh;": { "codepoints": [9579], "characters": "\u256B" },
+  "&boxVH;": { "codepoints": [9580], "characters": "\u256C" },
+  "&boxvl;": { "codepoints": [9508], "characters": "\u2524" },
+  "&boxvL;": { "codepoints": [9569], "characters": "\u2561" },
+  "&boxVl;": { "codepoints": [9570], "characters": "\u2562" },
+  "&boxVL;": { "codepoints": [9571], "characters": "\u2563" },
+  "&boxvr;": { "codepoints": [9500], "characters": "\u251C" },
+  "&boxvR;": { "codepoints": [9566], "characters": "\u255E" },
+  "&boxVr;": { "codepoints": [9567], "characters": "\u255F" },
+  "&boxVR;": { "codepoints": [9568], "characters": "\u2560" },
+  "&bprime;": { "codepoints": [8245], "characters": "\u2035" },
+  "&breve;": { "codepoints": [728], "characters": "\u02D8" },
+  "&Breve;": { "codepoints": [728], "characters": "\u02D8" },
+  "&brvbar;": { "codepoints": [166], "characters": "\u00A6" },
+  "&brvbar": { "codepoints": [166], "characters": "\u00A6" },
+  "&bscr;": { "codepoints": [119991], "characters": "\uD835\uDCB7" },
+  "&Bscr;": { "codepoints": [8492], "characters": "\u212C" },
+  "&bsemi;": { "codepoints": [8271], "characters": "\u204F" },
+  "&bsim;": { "codepoints": [8765], "characters": "\u223D" },
+  "&bsime;": { "codepoints": [8909], "characters": "\u22CD" },
+  "&bsolb;": { "codepoints": [10693], "characters": "\u29C5" },
+  "&bsol;": { "codepoints": [92], "characters": "\u005C" },
+  "&bsolhsub;": { "codepoints": [10184], "characters": "\u27C8" },
+  "&bull;": { "codepoints": [8226], "characters": "\u2022" },
+  "&bullet;": { "codepoints": [8226], "characters": "\u2022" },
+  "&bump;": { "codepoints": [8782], "characters": "\u224E" },
+  "&bumpE;": { "codepoints": [10926], "characters": "\u2AAE" },
+  "&bumpe;": { "codepoints": [8783], "characters": "\u224F" },
+  "&Bumpeq;": { "codepoints": [8782], "characters": "\u224E" },
+  "&bumpeq;": { "codepoints": [8783], "characters": "\u224F" },
+  "&Cacute;": { "codepoints": [262], "characters": "\u0106" },
+  "&cacute;": { "codepoints": [263], "characters": "\u0107" },
+  "&capand;": { "codepoints": [10820], "characters": "\u2A44" },
+  "&capbrcup;": { "codepoints": [10825], "characters": "\u2A49" },
+  "&capcap;": { "codepoints": [10827], "characters": "\u2A4B" },
+  "&cap;": { "codepoints": [8745], "characters": "\u2229" },
+  "&Cap;": { "codepoints": [8914], "characters": "\u22D2" },
+  "&capcup;": { "codepoints": [10823], "characters": "\u2A47" },
+  "&capdot;": { "codepoints": [10816], "characters": "\u2A40" },
+  "&CapitalDifferentialD;": { "codepoints": [8517], "characters": "\u2145" },
+  "&caps;": { "codepoints": [8745, 65024], "characters": "\u2229\uFE00" },
+  "&caret;": { "codepoints": [8257], "characters": "\u2041" },
+  "&caron;": { "codepoints": [711], "characters": "\u02C7" },
+  "&Cayleys;": { "codepoints": [8493], "characters": "\u212D" },
+  "&ccaps;": { "codepoints": [10829], "characters": "\u2A4D" },
+  "&Ccaron;": { "codepoints": [268], "characters": "\u010C" },
+  "&ccaron;": { "codepoints": [269], "characters": "\u010D" },
+  "&Ccedil;": { "codepoints": [199], "characters": "\u00C7" },
+  "&Ccedil": { "codepoints": [199], "characters": "\u00C7" },
+  "&ccedil;": { "codepoints": [231], "characters": "\u00E7" },
+  "&ccedil": { "codepoints": [231], "characters": "\u00E7" },
+  "&Ccirc;": { "codepoints": [264], "characters": "\u0108" },
+  "&ccirc;": { "codepoints": [265], "characters": "\u0109" },
+  "&Cconint;": { "codepoints": [8752], "characters": "\u2230" },
+  "&ccups;": { "codepoints": [10828], "characters": "\u2A4C" },
+  "&ccupssm;": { "codepoints": [10832], "characters": "\u2A50" },
+  "&Cdot;": { "codepoints": [266], "characters": "\u010A" },
+  "&cdot;": { "codepoints": [267], "characters": "\u010B" },
+  "&cedil;": { "codepoints": [184], "characters": "\u00B8" },
+  "&cedil": { "codepoints": [184], "characters": "\u00B8" },
+  "&Cedilla;": { "codepoints": [184], "characters": "\u00B8" },
+  "&cemptyv;": { "codepoints": [10674], "characters": "\u29B2" },
+  "&cent;": { "codepoints": [162], "characters": "\u00A2" },
+  "&cent": { "codepoints": [162], "characters": "\u00A2" },
+  "&centerdot;": { "codepoints": [183], "characters": "\u00B7" },
+  "&CenterDot;": { "codepoints": [183], "characters": "\u00B7" },
+  "&cfr;": { "codepoints": [120096], "characters": "\uD835\uDD20" },
+  "&Cfr;": { "codepoints": [8493], "characters": "\u212D" },
+  "&CHcy;": { "codepoints": [1063], "characters": "\u0427" },
+  "&chcy;": { "codepoints": [1095], "characters": "\u0447" },
+  "&check;": { "codepoints": [10003], "characters": "\u2713" },
+  "&checkmark;": { "codepoints": [10003], "characters": "\u2713" },
+  "&Chi;": { "codepoints": [935], "characters": "\u03A7" },
+  "&chi;": { "codepoints": [967], "characters": "\u03C7" },
+  "&circ;": { "codepoints": [710], "characters": "\u02C6" },
+  "&circeq;": { "codepoints": [8791], "characters": "\u2257" },
+  "&circlearrowleft;": { "codepoints": [8634], "characters": "\u21BA" },
+  "&circlearrowright;": { "codepoints": [8635], "characters": "\u21BB" },
+  "&circledast;": { "codepoints": [8859], "characters": "\u229B" },
+  "&circledcirc;": { "codepoints": [8858], "characters": "\u229A" },
+  "&circleddash;": { "codepoints": [8861], "characters": "\u229D" },
+  "&CircleDot;": { "codepoints": [8857], "characters": "\u2299" },
+  "&circledR;": { "codepoints": [174], "characters": "\u00AE" },
+  "&circledS;": { "codepoints": [9416], "characters": "\u24C8" },
+  "&CircleMinus;": { "codepoints": [8854], "characters": "\u2296" },
+  "&CirclePlus;": { "codepoints": [8853], "characters": "\u2295" },
+  "&CircleTimes;": { "codepoints": [8855], "characters": "\u2297" },
+  "&cir;": { "codepoints": [9675], "characters": "\u25CB" },
+  "&cirE;": { "codepoints": [10691], "characters": "\u29C3" },
+  "&cire;": { "codepoints": [8791], "characters": "\u2257" },
+  "&cirfnint;": { "codepoints": [10768], "characters": "\u2A10" },
+  "&cirmid;": { "codepoints": [10991], "characters": "\u2AEF" },
+  "&cirscir;": { "codepoints": [10690], "characters": "\u29C2" },
+  "&ClockwiseContourIntegral;": { "codepoints": [8754], "characters": "\u2232" },
+  "&CloseCurlyDoubleQuote;": { "codepoints": [8221], "characters": "\u201D" },
+  "&CloseCurlyQuote;": { "codepoints": [8217], "characters": "\u2019" },
+  "&clubs;": { "codepoints": [9827], "characters": "\u2663" },
+  "&clubsuit;": { "codepoints": [9827], "characters": "\u2663" },
+  "&colon;": { "codepoints": [58], "characters": "\u003A" },
+  "&Colon;": { "codepoints": [8759], "characters": "\u2237" },
+  "&Colone;": { "codepoints": [10868], "characters": "\u2A74" },
+  "&colone;": { "codepoints": [8788], "characters": "\u2254" },
+  "&coloneq;": { "codepoints": [8788], "characters": "\u2254" },
+  "&comma;": { "codepoints": [44], "characters": "\u002C" },
+  "&commat;": { "codepoints": [64], "characters": "\u0040" },
+  "&comp;": { "codepoints": [8705], "characters": "\u2201" },
+  "&compfn;": { "codepoints": [8728], "characters": "\u2218" },
+  "&complement;": { "codepoints": [8705], "characters": "\u2201" },
+  "&complexes;": { "codepoints": [8450], "characters": "\u2102" },
+  "&cong;": { "codepoints": [8773], "characters": "\u2245" },
+  "&congdot;": { "codepoints": [10861], "characters": "\u2A6D" },
+  "&Congruent;": { "codepoints": [8801], "characters": "\u2261" },
+  "&conint;": { "codepoints": [8750], "characters": "\u222E" },
+  "&Conint;": { "codepoints": [8751], "characters": "\u222F" },
+  "&ContourIntegral;": { "codepoints": [8750], "characters": "\u222E" },
+  "&copf;": { "codepoints": [120148], "characters": "\uD835\uDD54" },
+  "&Copf;": { "codepoints": [8450], "characters": "\u2102" },
+  "&coprod;": { "codepoints": [8720], "characters": "\u2210" },
+  "&Coproduct;": { "codepoints": [8720], "characters": "\u2210" },
+  "&copy;": { "codepoints": [169], "characters": "\u00A9" },
+  "&copy": { "codepoints": [169], "characters": "\u00A9" },
+  "&COPY;": { "codepoints": [169], "characters": "\u00A9" },
+  "&COPY": { "codepoints": [169], "characters": "\u00A9" },
+  "&copysr;": { "codepoints": [8471], "characters": "\u2117" },
+  "&CounterClockwiseContourIntegral;": { "codepoints": [8755], "characters": "\u2233" },
+  "&crarr;": { "codepoints": [8629], "characters": "\u21B5" },
+  "&cross;": { "codepoints": [10007], "characters": "\u2717" },
+  "&Cross;": { "codepoints": [10799], "characters": "\u2A2F" },
+  "&Cscr;": { "codepoints": [119966], "characters": "\uD835\uDC9E" },
+  "&cscr;": { "codepoints": [119992], "characters": "\uD835\uDCB8" },
+  "&csub;": { "codepoints": [10959], "characters": "\u2ACF" },
+  "&csube;": { "codepoints": [10961], "characters": "\u2AD1" },
+  "&csup;": { "codepoints": [10960], "characters": "\u2AD0" },
+  "&csupe;": { "codepoints": [10962], "characters": "\u2AD2" },
+  "&ctdot;": { "codepoints": [8943], "characters": "\u22EF" },
+  "&cudarrl;": { "codepoints": [10552], "characters": "\u2938" },
+  "&cudarrr;": { "codepoints": [10549], "characters": "\u2935" },
+  "&cuepr;": { "codepoints": [8926], "characters": "\u22DE" },
+  "&cuesc;": { "codepoints": [8927], "characters": "\u22DF" },
+  "&cularr;": { "codepoints": [8630], "characters": "\u21B6" },
+  "&cularrp;": { "codepoints": [10557], "characters": "\u293D" },
+  "&cupbrcap;": { "codepoints": [10824], "characters": "\u2A48" },
+  "&cupcap;": { "codepoints": [10822], "characters": "\u2A46" },
+  "&CupCap;": { "codepoints": [8781], "characters": "\u224D" },
+  "&cup;": { "codepoints": [8746], "characters": "\u222A" },
+  "&Cup;": { "codepoints": [8915], "characters": "\u22D3" },
+  "&cupcup;": { "codepoints": [10826], "characters": "\u2A4A" },
+  "&cupdot;": { "codepoints": [8845], "characters": "\u228D" },
+  "&cupor;": { "codepoints": [10821], "characters": "\u2A45" },
+  "&cups;": { "codepoints": [8746, 65024], "characters": "\u222A\uFE00" },
+  "&curarr;": { "codepoints": [8631], "characters": "\u21B7" },
+  "&curarrm;": { "codepoints": [10556], "characters": "\u293C" },
+  "&curlyeqprec;": { "codepoints": [8926], "characters": "\u22DE" },
+  "&curlyeqsucc;": { "codepoints": [8927], "characters": "\u22DF" },
+  "&curlyvee;": { "codepoints": [8910], "characters": "\u22CE" },
+  "&curlywedge;": { "codepoints": [8911], "characters": "\u22CF" },
+  "&curren;": { "codepoints": [164], "characters": "\u00A4" },
+  "&curren": { "codepoints": [164], "characters": "\u00A4" },
+  "&curvearrowleft;": { "codepoints": [8630], "characters": "\u21B6" },
+  "&curvearrowright;": { "codepoints": [8631], "characters": "\u21B7" },
+  "&cuvee;": { "codepoints": [8910], "characters": "\u22CE" },
+  "&cuwed;": { "codepoints": [8911], "characters": "\u22CF" },
+  "&cwconint;": { "codepoints": [8754], "characters": "\u2232" },
+  "&cwint;": { "codepoints": [8753], "characters": "\u2231" },
+  "&cylcty;": { "codepoints": [9005], "characters": "\u232D" },
+  "&dagger;": { "codepoints": [8224], "characters": "\u2020" },
+  "&Dagger;": { "codepoints": [8225], "characters": "\u2021" },
+  "&daleth;": { "codepoints": [8504], "characters": "\u2138" },
+  "&darr;": { "codepoints": [8595], "characters": "\u2193" },
+  "&Darr;": { "codepoints": [8609], "characters": "\u21A1" },
+  "&dArr;": { "codepoints": [8659], "characters": "\u21D3" },
+  "&dash;": { "codepoints": [8208], "characters": "\u2010" },
+  "&Dashv;": { "codepoints": [10980], "characters": "\u2AE4" },
+  "&dashv;": { "codepoints": [8867], "characters": "\u22A3" },
+  "&dbkarow;": { "codepoints": [10511], "characters": "\u290F" },
+  "&dblac;": { "codepoints": [733], "characters": "\u02DD" },
+  "&Dcaron;": { "codepoints": [270], "characters": "\u010E" },
+  "&dcaron;": { "codepoints": [271], "characters": "\u010F" },
+  "&Dcy;": { "codepoints": [1044], "characters": "\u0414" },
+  "&dcy;": { "codepoints": [1076], "characters": "\u0434" },
+  "&ddagger;": { "codepoints": [8225], "characters": "\u2021" },
+  "&ddarr;": { "codepoints": [8650], "characters": "\u21CA" },
+  "&DD;": { "codepoints": [8517], "characters": "\u2145" },
+  "&dd;": { "codepoints": [8518], "characters": "\u2146" },
+  "&DDotrahd;": { "codepoints": [10513], "characters": "\u2911" },
+  "&ddotseq;": { "codepoints": [10871], "characters": "\u2A77" },
+  "&deg;": { "codepoints": [176], "characters": "\u00B0" },
+  "&deg": { "codepoints": [176], "characters": "\u00B0" },
+  "&Del;": { "codepoints": [8711], "characters": "\u2207" },
+  "&Delta;": { "codepoints": [916], "characters": "\u0394" },
+  "&delta;": { "codepoints": [948], "characters": "\u03B4" },
+  "&demptyv;": { "codepoints": [10673], "characters": "\u29B1" },
+  "&dfisht;": { "codepoints": [10623], "characters": "\u297F" },
+  "&Dfr;": { "codepoints": [120071], "characters": "\uD835\uDD07" },
+  "&dfr;": { "codepoints": [120097], "characters": "\uD835\uDD21" },
+  "&dHar;": { "codepoints": [10597], "characters": "\u2965" },
+  "&dharl;": { "codepoints": [8643], "characters": "\u21C3" },
+  "&dharr;": { "codepoints": [8642], "characters": "\u21C2" },
+  "&DiacriticalAcute;": { "codepoints": [180], "characters": "\u00B4" },
+  "&DiacriticalDot;": { "codepoints": [729], "characters": "\u02D9" },
+  "&DiacriticalDoubleAcute;": { "codepoints": [733], "characters": "\u02DD" },
+  "&DiacriticalGrave;": { "codepoints": [96], "characters": "\u0060" },
+  "&DiacriticalTilde;": { "codepoints": [732], "characters": "\u02DC" },
+  "&diam;": { "codepoints": [8900], "characters": "\u22C4" },
+  "&diamond;": { "codepoints": [8900], "characters": "\u22C4" },
+  "&Diamond;": { "codepoints": [8900], "characters": "\u22C4" },
+  "&diamondsuit;": { "codepoints": [9830], "characters": "\u2666" },
+  "&diams;": { "codepoints": [9830], "characters": "\u2666" },
+  "&die;": { "codepoints": [168], "characters": "\u00A8" },
+  "&DifferentialD;": { "codepoints": [8518], "characters": "\u2146" },
+  "&digamma;": { "codepoints": [989], "characters": "\u03DD" },
+  "&disin;": { "codepoints": [8946], "characters": "\u22F2" },
+  "&div;": { "codepoints": [247], "characters": "\u00F7" },
+  "&divide;": { "codepoints": [247], "characters": "\u00F7" },
+  "&divide": { "codepoints": [247], "characters": "\u00F7" },
+  "&divideontimes;": { "codepoints": [8903], "characters": "\u22C7" },
+  "&divonx;": { "codepoints": [8903], "characters": "\u22C7" },
+  "&DJcy;": { "codepoints": [1026], "characters": "\u0402" },
+  "&djcy;": { "codepoints": [1106], "characters": "\u0452" },
+  "&dlcorn;": { "codepoints": [8990], "characters": "\u231E" },
+  "&dlcrop;": { "codepoints": [8973], "characters": "\u230D" },
+  "&dollar;": { "codepoints": [36], "characters": "\u0024" },
+  "&Dopf;": { "codepoints": [120123], "characters": "\uD835\uDD3B" },
+  "&dopf;": { "codepoints": [120149], "characters": "\uD835\uDD55" },
+  "&Dot;": { "codepoints": [168], "characters": "\u00A8" },
+  "&dot;": { "codepoints": [729], "characters": "\u02D9" },
+  "&DotDot;": { "codepoints": [8412], "characters": "\u20DC" },
+  "&doteq;": { "codepoints": [8784], "characters": "\u2250" },
+  "&doteqdot;": { "codepoints": [8785], "characters": "\u2251" },
+  "&DotEqual;": { "codepoints": [8784], "characters": "\u2250" },
+  "&dotminus;": { "codepoints": [8760], "characters": "\u2238" },
+  "&dotplus;": { "codepoints": [8724], "characters": "\u2214" },
+  "&dotsquare;": { "codepoints": [8865], "characters": "\u22A1" },
+  "&doublebarwedge;": { "codepoints": [8966], "characters": "\u2306" },
+  "&DoubleContourIntegral;": { "codepoints": [8751], "characters": "\u222F" },
+  "&DoubleDot;": { "codepoints": [168], "characters": "\u00A8" },
+  "&DoubleDownArrow;": { "codepoints": [8659], "characters": "\u21D3" },
+  "&DoubleLeftArrow;": { "codepoints": [8656], "characters": "\u21D0" },
+  "&DoubleLeftRightArrow;": { "codepoints": [8660], "characters": "\u21D4" },
+  "&DoubleLeftTee;": { "codepoints": [10980], "characters": "\u2AE4" },
+  "&DoubleLongLeftArrow;": { "codepoints": [10232], "characters": "\u27F8" },
+  "&DoubleLongLeftRightArrow;": { "codepoints": [10234], "characters": "\u27FA" },
+  "&DoubleLongRightArrow;": { "codepoints": [10233], "characters": "\u27F9" },
+  "&DoubleRightArrow;": { "codepoints": [8658], "characters": "\u21D2" },
+  "&DoubleRightTee;": { "codepoints": [8872], "characters": "\u22A8" },
+  "&DoubleUpArrow;": { "codepoints": [8657], "characters": "\u21D1" },
+  "&DoubleUpDownArrow;": { "codepoints": [8661], "characters": "\u21D5" },
+  "&DoubleVerticalBar;": { "codepoints": [8741], "characters": "\u2225" },
+  "&DownArrowBar;": { "codepoints": [10515], "characters": "\u2913" },
+  "&downarrow;": { "codepoints": [8595], "characters": "\u2193" },
+  "&DownArrow;": { "codepoints": [8595], "characters": "\u2193" },
+  "&Downarrow;": { "codepoints": [8659], "characters": "\u21D3" },
+  "&DownArrowUpArrow;": { "codepoints": [8693], "characters": "\u21F5" },
+  "&DownBreve;": { "codepoints": [785], "characters": "\u0311" },
+  "&downdownarrows;": { "codepoints": [8650], "characters": "\u21CA" },
+  "&downharpoonleft;": { "codepoints": [8643], "characters": "\u21C3" },
+  "&downharpoonright;": { "codepoints": [8642], "characters": "\u21C2" },
+  "&DownLeftRightVector;": { "codepoints": [10576], "characters": "\u2950" },
+  "&DownLeftTeeVector;": { "codepoints": [10590], "characters": "\u295E" },
+  "&DownLeftVectorBar;": { "codepoints": [10582], "characters": "\u2956" },
+  "&DownLeftVector;": { "codepoints": [8637], "characters": "\u21BD" },
+  "&DownRightTeeVector;": { "codepoints": [10591], "characters": "\u295F" },
+  "&DownRightVectorBar;": { "codepoints": [10583], "characters": "\u2957" },
+  "&DownRightVector;": { "codepoints": [8641], "characters": "\u21C1" },
+  "&DownTeeArrow;": { "codepoints": [8615], "characters": "\u21A7" },
+  "&DownTee;": { "codepoints": [8868], "characters": "\u22A4" },
+  "&drbkarow;": { "codepoints": [10512], "characters": "\u2910" },
+  "&drcorn;": { "codepoints": [8991], "characters": "\u231F" },
+  "&drcrop;": { "codepoints": [8972], "characters": "\u230C" },
+  "&Dscr;": { "codepoints": [119967], "characters": "\uD835\uDC9F" },
+  "&dscr;": { "codepoints": [119993], "characters": "\uD835\uDCB9" },
+  "&DScy;": { "codepoints": [1029], "characters": "\u0405" },
+  "&dscy;": { "codepoints": [1109], "characters": "\u0455" },
+  "&dsol;": { "codepoints": [10742], "characters": "\u29F6" },
+  "&Dstrok;": { "codepoints": [272], "characters": "\u0110" },
+  "&dstrok;": { "codepoints": [273], "characters": "\u0111" },
+  "&dtdot;": { "codepoints": [8945], "characters": "\u22F1" },
+  "&dtri;": { "codepoints": [9663], "characters": "\u25BF" },
+  "&dtrif;": { "codepoints": [9662], "characters": "\u25BE" },
+  "&duarr;": { "codepoints": [8693], "characters": "\u21F5" },
+  "&duhar;": { "codepoints": [10607], "characters": "\u296F" },
+  "&dwangle;": { "codepoints": [10662], "characters": "\u29A6" },
+  "&DZcy;": { "codepoints": [1039], "characters": "\u040F" },
+  "&dzcy;": { "codepoints": [1119], "characters": "\u045F" },
+  "&dzigrarr;": { "codepoints": [10239], "characters": "\u27FF" },
+  "&Eacute;": { "codepoints": [201], "characters": "\u00C9" },
+  "&Eacute": { "codepoints": [201], "characters": "\u00C9" },
+  "&eacute;": { "codepoints": [233], "characters": "\u00E9" },
+  "&eacute": { "codepoints": [233], "characters": "\u00E9" },
+  "&easter;": { "codepoints": [10862], "characters": "\u2A6E" },
+  "&Ecaron;": { "codepoints": [282], "characters": "\u011A" },
+  "&ecaron;": { "codepoints": [283], "characters": "\u011B" },
+  "&Ecirc;": { "codepoints": [202], "characters": "\u00CA" },
+  "&Ecirc": { "codepoints": [202], "characters": "\u00CA" },
+  "&ecirc;": { "codepoints": [234], "characters": "\u00EA" },
+  "&ecirc": { "codepoints": [234], "characters": "\u00EA" },
+  "&ecir;": { "codepoints": [8790], "characters": "\u2256" },
+  "&ecolon;": { "codepoints": [8789], "characters": "\u2255" },
+  "&Ecy;": { "codepoints": [1069], "characters": "\u042D" },
+  "&ecy;": { "codepoints": [1101], "characters": "\u044D" },
+  "&eDDot;": { "codepoints": [10871], "characters": "\u2A77" },
+  "&Edot;": { "codepoints": [278], "characters": "\u0116" },
+  "&edot;": { "codepoints": [279], "characters": "\u0117" },
+  "&eDot;": { "codepoints": [8785], "characters": "\u2251" },
+  "&ee;": { "codepoints": [8519], "characters": "\u2147" },
+  "&efDot;": { "codepoints": [8786], "characters": "\u2252" },
+  "&Efr;": { "codepoints": [120072], "characters": "\uD835\uDD08" },
+  "&efr;": { "codepoints": [120098], "characters": "\uD835\uDD22" },
+  "&eg;": { "codepoints": [10906], "characters": "\u2A9A" },
+  "&Egrave;": { "codepoints": [200], "characters": "\u00C8" },
+  "&Egrave": { "codepoints": [200], "characters": "\u00C8" },
+  "&egrave;": { "codepoints": [232], "characters": "\u00E8" },
+  "&egrave": { "codepoints": [232], "characters": "\u00E8" },
+  "&egs;": { "codepoints": [10902], "characters": "\u2A96" },
+  "&egsdot;": { "codepoints": [10904], "characters": "\u2A98" },
+  "&el;": { "codepoints": [10905], "characters": "\u2A99" },
+  "&Element;": { "codepoints": [8712], "characters": "\u2208" },
+  "&elinters;": { "codepoints": [9191], "characters": "\u23E7" },
+  "&ell;": { "codepoints": [8467], "characters": "\u2113" },
+  "&els;": { "codepoints": [10901], "characters": "\u2A95" },
+  "&elsdot;": { "codepoints": [10903], "characters": "\u2A97" },
+  "&Emacr;": { "codepoints": [274], "characters": "\u0112" },
+  "&emacr;": { "codepoints": [275], "characters": "\u0113" },
+  "&empty;": { "codepoints": [8709], "characters": "\u2205" },
+  "&emptyset;": { "codepoints": [8709], "characters": "\u2205" },
+  "&EmptySmallSquare;": { "codepoints": [9723], "characters": "\u25FB" },
+  "&emptyv;": { "codepoints": [8709], "characters": "\u2205" },
+  "&EmptyVerySmallSquare;": { "codepoints": [9643], "characters": "\u25AB" },
+  "&emsp13;": { "codepoints": [8196], "characters": "\u2004" },
+  "&emsp14;": { "codepoints": [8197], "characters": "\u2005" },
+  "&emsp;": { "codepoints": [8195], "characters": "\u2003" },
+  "&ENG;": { "codepoints": [330], "characters": "\u014A" },
+  "&eng;": { "codepoints": [331], "characters": "\u014B" },
+  "&ensp;": { "codepoints": [8194], "characters": "\u2002" },
+  "&Eogon;": { "codepoints": [280], "characters": "\u0118" },
+  "&eogon;": { "codepoints": [281], "characters": "\u0119" },
+  "&Eopf;": { "codepoints": [120124], "characters": "\uD835\uDD3C" },
+  "&eopf;": { "codepoints": [120150], "characters": "\uD835\uDD56" },
+  "&epar;": { "codepoints": [8917], "characters": "\u22D5" },
+  "&eparsl;": { "codepoints": [10723], "characters": "\u29E3" },
+  "&eplus;": { "codepoints": [10865], "characters": "\u2A71" },
+  "&epsi;": { "codepoints": [949], "characters": "\u03B5" },
+  "&Epsilon;": { "codepoints": [917], "characters": "\u0395" },
+  "&epsilon;": { "codepoints": [949], "characters": "\u03B5" },
+  "&epsiv;": { "codepoints": [1013], "characters": "\u03F5" },
+  "&eqcirc;": { "codepoints": [8790], "characters": "\u2256" },
+  "&eqcolon;": { "codepoints": [8789], "characters": "\u2255" },
+  "&eqsim;": { "codepoints": [8770], "characters": "\u2242" },
+  "&eqslantgtr;": { "codepoints": [10902], "characters": "\u2A96" },
+  "&eqslantless;": { "codepoints": [10901], "characters": "\u2A95" },
+  "&Equal;": { "codepoints": [10869], "characters": "\u2A75" },
+  "&equals;": { "codepoints": [61], "characters": "\u003D" },
+  "&EqualTilde;": { "codepoints": [8770], "characters": "\u2242" },
+  "&equest;": { "codepoints": [8799], "characters": "\u225F" },
+  "&Equilibrium;": { "codepoints": [8652], "characters": "\u21CC" },
+  "&equiv;": { "codepoints": [8801], "characters": "\u2261" },
+  "&equivDD;": { "codepoints": [10872], "characters": "\u2A78" },
+  "&eqvparsl;": { "codepoints": [10725], "characters": "\u29E5" },
+  "&erarr;": { "codepoints": [10609], "characters": "\u2971" },
+  "&erDot;": { "codepoints": [8787], "characters": "\u2253" },
+  "&escr;": { "codepoints": [8495], "characters": "\u212F" },
+  "&Escr;": { "codepoints": [8496], "characters": "\u2130" },
+  "&esdot;": { "codepoints": [8784], "characters": "\u2250" },
+  "&Esim;": { "codepoints": [10867], "characters": "\u2A73" },
+  "&esim;": { "codepoints": [8770], "characters": "\u2242" },
+  "&Eta;": { "codepoints": [919], "characters": "\u0397" },
+  "&eta;": { "codepoints": [951], "characters": "\u03B7" },
+  "&ETH;": { "codepoints": [208], "characters": "\u00D0" },
+  "&ETH": { "codepoints": [208], "characters": "\u00D0" },
+  "&eth;": { "codepoints": [240], "characters": "\u00F0" },
+  "&eth": { "codepoints": [240], "characters": "\u00F0" },
+  "&Euml;": { "codepoints": [203], "characters": "\u00CB" },
+  "&Euml": { "codepoints": [203], "characters": "\u00CB" },
+  "&euml;": { "codepoints": [235], "characters": "\u00EB" },
+  "&euml": { "codepoints": [235], "characters": "\u00EB" },
+  "&euro;": { "codepoints": [8364], "characters": "\u20AC" },
+  "&excl;": { "codepoints": [33], "characters": "\u0021" },
+  "&exist;": { "codepoints": [8707], "characters": "\u2203" },
+  "&Exists;": { "codepoints": [8707], "characters": "\u2203" },
+  "&expectation;": { "codepoints": [8496], "characters": "\u2130" },
+  "&exponentiale;": { "codepoints": [8519], "characters": "\u2147" },
+  "&ExponentialE;": { "codepoints": [8519], "characters": "\u2147" },
+  "&fallingdotseq;": { "codepoints": [8786], "characters": "\u2252" },
+  "&Fcy;": { "codepoints": [1060], "characters": "\u0424" },
+  "&fcy;": { "codepoints": [1092], "characters": "\u0444" },
+  "&female;": { "codepoints": [9792], "characters": "\u2640" },
+  "&ffilig;": { "codepoints": [64259], "characters": "\uFB03" },
+  "&fflig;": { "codepoints": [64256], "characters": "\uFB00" },
+  "&ffllig;": { "codepoints": [64260], "characters": "\uFB04" },
+  "&Ffr;": { "codepoints": [120073], "characters": "\uD835\uDD09" },
+  "&ffr;": { "codepoints": [120099], "characters": "\uD835\uDD23" },
+  "&filig;": { "codepoints": [64257], "characters": "\uFB01" },
+  "&FilledSmallSquare;": { "codepoints": [9724], "characters": "\u25FC" },
+  "&FilledVerySmallSquare;": { "codepoints": [9642], "characters": "\u25AA" },
+  "&fjlig;": { "codepoints": [102, 106], "characters": "\u0066\u006A" },
+  "&flat;": { "codepoints": [9837], "characters": "\u266D" },
+  "&fllig;": { "codepoints": [64258], "characters": "\uFB02" },
+  "&fltns;": { "codepoints": [9649], "characters": "\u25B1" },
+  "&fnof;": { "codepoints": [402], "characters": "\u0192" },
+  "&Fopf;": { "codepoints": [120125], "characters": "\uD835\uDD3D" },
+  "&fopf;": { "codepoints": [120151], "characters": "\uD835\uDD57" },
+  "&forall;": { "codepoints": [8704], "characters": "\u2200" },
+  "&ForAll;": { "codepoints": [8704], "characters": "\u2200" },
+  "&fork;": { "codepoints": [8916], "characters": "\u22D4" },
+  "&forkv;": { "codepoints": [10969], "characters": "\u2AD9" },
+  "&Fouriertrf;": { "codepoints": [8497], "characters": "\u2131" },
+  "&fpartint;": { "codepoints": [10765], "characters": "\u2A0D" },
+  "&frac12;": { "codepoints": [189], "characters": "\u00BD" },
+  "&frac12": { "codepoints": [189], "characters": "\u00BD" },
+  "&frac13;": { "codepoints": [8531], "characters": "\u2153" },
+  "&frac14;": { "codepoints": [188], "characters": "\u00BC" },
+  "&frac14": { "codepoints": [188], "characters": "\u00BC" },
+  "&frac15;": { "codepoints": [8533], "characters": "\u2155" },
+  "&frac16;": { "codepoints": [8537], "characters": "\u2159" },
+  "&frac18;": { "codepoints": [8539], "characters": "\u215B" },
+  "&frac23;": { "codepoints": [8532], "characters": "\u2154" },
+  "&frac25;": { "codepoints": [8534], "characters": "\u2156" },
+  "&frac34;": { "codepoints": [190], "characters": "\u00BE" },
+  "&frac34": { "codepoints": [190], "characters": "\u00BE" },
+  "&frac35;": { "codepoints": [8535], "characters": "\u2157" },
+  "&frac38;": { "codepoints": [8540], "characters": "\u215C" },
+  "&frac45;": { "codepoints": [8536], "characters": "\u2158" },
+  "&frac56;": { "codepoints": [8538], "characters": "\u215A" },
+  "&frac58;": { "codepoints": [8541], "characters": "\u215D" },
+  "&frac78;": { "codepoints": [8542], "characters": "\u215E" },
+  "&frasl;": { "codepoints": [8260], "characters": "\u2044" },
+  "&frown;": { "codepoints": [8994], "characters": "\u2322" },
+  "&fscr;": { "codepoints": [119995], "characters": "\uD835\uDCBB" },
+  "&Fscr;": { "codepoints": [8497], "characters": "\u2131" },
+  "&gacute;": { "codepoints": [501], "characters": "\u01F5" },
+  "&Gamma;": { "codepoints": [915], "characters": "\u0393" },
+  "&gamma;": { "codepoints": [947], "characters": "\u03B3" },
+  "&Gammad;": { "codepoints": [988], "characters": "\u03DC" },
+  "&gammad;": { "codepoints": [989], "characters": "\u03DD" },
+  "&gap;": { "codepoints": [10886], "characters": "\u2A86" },
+  "&Gbreve;": { "codepoints": [286], "characters": "\u011E" },
+  "&gbreve;": { "codepoints": [287], "characters": "\u011F" },
+  "&Gcedil;": { "codepoints": [290], "characters": "\u0122" },
+  "&Gcirc;": { "codepoints": [284], "characters": "\u011C" },
+  "&gcirc;": { "codepoints": [285], "characters": "\u011D" },
+  "&Gcy;": { "codepoints": [1043], "characters": "\u0413" },
+  "&gcy;": { "codepoints": [1075], "characters": "\u0433" },
+  "&Gdot;": { "codepoints": [288], "characters": "\u0120" },
+  "&gdot;": { "codepoints": [289], "characters": "\u0121" },
+  "&ge;": { "codepoints": [8805], "characters": "\u2265" },
+  "&gE;": { "codepoints": [8807], "characters": "\u2267" },
+  "&gEl;": { "codepoints": [10892], "characters": "\u2A8C" },
+  "&gel;": { "codepoints": [8923], "characters": "\u22DB" },
+  "&geq;": { "codepoints": [8805], "characters": "\u2265" },
+  "&geqq;": { "codepoints": [8807], "characters": "\u2267" },
+  "&geqslant;": { "codepoints": [10878], "characters": "\u2A7E" },
+  "&gescc;": { "codepoints": [10921], "characters": "\u2AA9" },
+  "&ges;": { "codepoints": [10878], "characters": "\u2A7E" },
+  "&gesdot;": { "codepoints": [10880], "characters": "\u2A80" },
+  "&gesdoto;": { "codepoints": [10882], "characters": "\u2A82" },
+  "&gesdotol;": { "codepoints": [10884], "characters": "\u2A84" },
+  "&gesl;": { "codepoints": [8923, 65024], "characters": "\u22DB\uFE00" },
+  "&gesles;": { "codepoints": [10900], "characters": "\u2A94" },
+  "&Gfr;": { "codepoints": [120074], "characters": "\uD835\uDD0A" },
+  "&gfr;": { "codepoints": [120100], "characters": "\uD835\uDD24" },
+  "&gg;": { "codepoints": [8811], "characters": "\u226B" },
+  "&Gg;": { "codepoints": [8921], "characters": "\u22D9" },
+  "&ggg;": { "codepoints": [8921], "characters": "\u22D9" },
+  "&gimel;": { "codepoints": [8503], "characters": "\u2137" },
+  "&GJcy;": { "codepoints": [1027], "characters": "\u0403" },
+  "&gjcy;": { "codepoints": [1107], "characters": "\u0453" },
+  "&gla;": { "codepoints": [10917], "characters": "\u2AA5" },
+  "&gl;": { "codepoints": [8823], "characters": "\u2277" },
+  "&glE;": { "codepoints": [10898], "characters": "\u2A92" },
+  "&glj;": { "codepoints": [10916], "characters": "\u2AA4" },
+  "&gnap;": { "codepoints": [10890], "characters": "\u2A8A" },
+  "&gnapprox;": { "codepoints": [10890], "characters": "\u2A8A" },
+  "&gne;": { "codepoints": [10888], "characters": "\u2A88" },
+  "&gnE;": { "codepoints": [8809], "characters": "\u2269" },
+  "&gneq;": { "codepoints": [10888], "characters": "\u2A88" },
+  "&gneqq;": { "codepoints": [8809], "characters": "\u2269" },
+  "&gnsim;": { "codepoints": [8935], "characters": "\u22E7" },
+  "&Gopf;": { "codepoints": [120126], "characters": "\uD835\uDD3E" },
+  "&gopf;": { "codepoints": [120152], "characters": "\uD835\uDD58" },
+  "&grave;": { "codepoints": [96], "characters": "\u0060" },
+  "&GreaterEqual;": { "codepoints": [8805], "characters": "\u2265" },
+  "&GreaterEqualLess;": { "codepoints": [8923], "characters": "\u22DB" },
+  "&GreaterFullEqual;": { "codepoints": [8807], "characters": "\u2267" },
+  "&GreaterGreater;": { "codepoints": [10914], "characters": "\u2AA2" },
+  "&GreaterLess;": { "codepoints": [8823], "characters": "\u2277" },
+  "&GreaterSlantEqual;": { "codepoints": [10878], "characters": "\u2A7E" },
+  "&GreaterTilde;": { "codepoints": [8819], "characters": "\u2273" },
+  "&Gscr;": { "codepoints": [119970], "characters": "\uD835\uDCA2" },
+  "&gscr;": { "codepoints": [8458], "characters": "\u210A" },
+  "&gsim;": { "codepoints": [8819], "characters": "\u2273" },
+  "&gsime;": { "codepoints": [10894], "characters": "\u2A8E" },
+  "&gsiml;": { "codepoints": [10896], "characters": "\u2A90" },
+  "&gtcc;": { "codepoints": [10919], "characters": "\u2AA7" },
+  "&gtcir;": { "codepoints": [10874], "characters": "\u2A7A" },
+  "&gt;": { "codepoints": [62], "characters": "\u003E" },
+  "&gt": { "codepoints": [62], "characters": "\u003E" },
+  "&GT;": { "codepoints": [62], "characters": "\u003E" },
+  "&GT": { "codepoints": [62], "characters": "\u003E" },
+  "&Gt;": { "codepoints": [8811], "characters": "\u226B" },
+  "&gtdot;": { "codepoints": [8919], "characters": "\u22D7" },
+  "&gtlPar;": { "codepoints": [10645], "characters": "\u2995" },
+  "&gtquest;": { "codepoints": [10876], "characters": "\u2A7C" },
+  "&gtrapprox;": { "codepoints": [10886], "characters": "\u2A86" },
+  "&gtrarr;": { "codepoints": [10616], "characters": "\u2978" },
+  "&gtrdot;": { "codepoints": [8919], "characters": "\u22D7" },
+  "&gtreqless;": { "codepoints": [8923], "characters": "\u22DB" },
+  "&gtreqqless;": { "codepoints": [10892], "characters": "\u2A8C" },
+  "&gtrless;": { "codepoints": [8823], "characters": "\u2277" },
+  "&gtrsim;": { "codepoints": [8819], "characters": "\u2273" },
+  "&gvertneqq;": { "codepoints": [8809, 65024], "characters": "\u2269\uFE00" },
+  "&gvnE;": { "codepoints": [8809, 65024], "characters": "\u2269\uFE00" },
+  "&Hacek;": { "codepoints": [711], "characters": "\u02C7" },
+  "&hairsp;": { "codepoints": [8202], "characters": "\u200A" },
+  "&half;": { "codepoints": [189], "characters": "\u00BD" },
+  "&hamilt;": { "codepoints": [8459], "characters": "\u210B" },
+  "&HARDcy;": { "codepoints": [1066], "characters": "\u042A" },
+  "&hardcy;": { "codepoints": [1098], "characters": "\u044A" },
+  "&harrcir;": { "codepoints": [10568], "characters": "\u2948" },
+  "&harr;": { "codepoints": [8596], "characters": "\u2194" },
+  "&hArr;": { "codepoints": [8660], "characters": "\u21D4" },
+  "&harrw;": { "codepoints": [8621], "characters": "\u21AD" },
+  "&Hat;": { "codepoints": [94], "characters": "\u005E" },
+  "&hbar;": { "codepoints": [8463], "characters": "\u210F" },
+  "&Hcirc;": { "codepoints": [292], "characters": "\u0124" },
+  "&hcirc;": { "codepoints": [293], "characters": "\u0125" },
+  "&hearts;": { "codepoints": [9829], "characters": "\u2665" },
+  "&heartsuit;": { "codepoints": [9829], "characters": "\u2665" },
+  "&hellip;": { "codepoints": [8230], "characters": "\u2026" },
+  "&hercon;": { "codepoints": [8889], "characters": "\u22B9" },
+  "&hfr;": { "codepoints": [120101], "characters": "\uD835\uDD25" },
+  "&Hfr;": { "codepoints": [8460], "characters": "\u210C" },
+  "&HilbertSpace;": { "codepoints": [8459], "characters": "\u210B" },
+  "&hksearow;": { "codepoints": [10533], "characters": "\u2925" },
+  "&hkswarow;": { "codepoints": [10534], "characters": "\u2926" },
+  "&hoarr;": { "codepoints": [8703], "characters": "\u21FF" },
+  "&homtht;": { "codepoints": [8763], "characters": "\u223B" },
+  "&hookleftarrow;": { "codepoints": [8617], "characters": "\u21A9" },
+  "&hookrightarrow;": { "codepoints": [8618], "characters": "\u21AA" },
+  "&hopf;": { "codepoints": [120153], "characters": "\uD835\uDD59" },
+  "&Hopf;": { "codepoints": [8461], "characters": "\u210D" },
+  "&horbar;": { "codepoints": [8213], "characters": "\u2015" },
+  "&HorizontalLine;": { "codepoints": [9472], "characters": "\u2500" },
+  "&hscr;": { "codepoints": [119997], "characters": "\uD835\uDCBD" },
+  "&Hscr;": { "codepoints": [8459], "characters": "\u210B" },
+  "&hslash;": { "codepoints": [8463], "characters": "\u210F" },
+  "&Hstrok;": { "codepoints": [294], "characters": "\u0126" },
+  "&hstrok;": { "codepoints": [295], "characters": "\u0127" },
+  "&HumpDownHump;": { "codepoints": [8782], "characters": "\u224E" },
+  "&HumpEqual;": { "codepoints": [8783], "characters": "\u224F" },
+  "&hybull;": { "codepoints": [8259], "characters": "\u2043" },
+  "&hyphen;": { "codepoints": [8208], "characters": "\u2010" },
+  "&Iacute;": { "codepoints": [205], "characters": "\u00CD" },
+  "&Iacute": { "codepoints": [205], "characters": "\u00CD" },
+  "&iacute;": { "codepoints": [237], "characters": "\u00ED" },
+  "&iacute": { "codepoints": [237], "characters": "\u00ED" },
+  "&ic;": { "codepoints": [8291], "characters": "\u2063" },
+  "&Icirc;": { "codepoints": [206], "characters": "\u00CE" },
+  "&Icirc": { "codepoints": [206], "characters": "\u00CE" },
+  "&icirc;": { "codepoints": [238], "characters": "\u00EE" },
+  "&icirc": { "codepoints": [238], "characters": "\u00EE" },
+  "&Icy;": { "codepoints": [1048], "characters": "\u0418" },
+  "&icy;": { "codepoints": [1080], "characters": "\u0438" },
+  "&Idot;": { "codepoints": [304], "characters": "\u0130" },
+  "&IEcy;": { "codepoints": [1045], "characters": "\u0415" },
+  "&iecy;": { "codepoints": [1077], "characters": "\u0435" },
+  "&iexcl;": { "codepoints": [161], "characters": "\u00A1" },
+  "&iexcl": { "codepoints": [161], "characters": "\u00A1" },
+  "&iff;": { "codepoints": [8660], "characters": "\u21D4" },
+  "&ifr;": { "codepoints": [120102], "characters": "\uD835\uDD26" },
+  "&Ifr;": { "codepoints": [8465], "characters": "\u2111" },
+  "&Igrave;": { "codepoints": [204], "characters": "\u00CC" },
+  "&Igrave": { "codepoints": [204], "characters": "\u00CC" },
+  "&igrave;": { "codepoints": [236], "characters": "\u00EC" },
+  "&igrave": { "codepoints": [236], "characters": "\u00EC" },
+  "&ii;": { "codepoints": [8520], "characters": "\u2148" },
+  "&iiiint;": { "codepoints": [10764], "characters": "\u2A0C" },
+  "&iiint;": { "codepoints": [8749], "characters": "\u222D" },
+  "&iinfin;": { "codepoints": [10716], "characters": "\u29DC" },
+  "&iiota;": { "codepoints": [8489], "characters": "\u2129" },
+  "&IJlig;": { "codepoints": [306], "characters": "\u0132" },
+  "&ijlig;": { "codepoints": [307], "characters": "\u0133" },
+  "&Imacr;": { "codepoints": [298], "characters": "\u012A" },
+  "&imacr;": { "codepoints": [299], "characters": "\u012B" },
+  "&image;": { "codepoints": [8465], "characters": "\u2111" },
+  "&ImaginaryI;": { "codepoints": [8520], "characters": "\u2148" },
+  "&imagline;": { "codepoints": [8464], "characters": "\u2110" },
+  "&imagpart;": { "codepoints": [8465], "characters": "\u2111" },
+  "&imath;": { "codepoints": [305], "characters": "\u0131" },
+  "&Im;": { "codepoints": [8465], "characters": "\u2111" },
+  "&imof;": { "codepoints": [8887], "characters": "\u22B7" },
+  "&imped;": { "codepoints": [437], "characters": "\u01B5" },
+  "&Implies;": { "codepoints": [8658], "characters": "\u21D2" },
+  "&incare;": { "codepoints": [8453], "characters": "\u2105" },
+  "&in;": { "codepoints": [8712], "characters": "\u2208" },
+  "&infin;": { "codepoints": [8734], "characters": "\u221E" },
+  "&infintie;": { "codepoints": [10717], "characters": "\u29DD" },
+  "&inodot;": { "codepoints": [305], "characters": "\u0131" },
+  "&intcal;": { "codepoints": [8890], "characters": "\u22BA" },
+  "&int;": { "codepoints": [8747], "characters": "\u222B" },
+  "&Int;": { "codepoints": [8748], "characters": "\u222C" },
+  "&integers;": { "codepoints": [8484], "characters": "\u2124" },
+  "&Integral;": { "codepoints": [8747], "characters": "\u222B" },
+  "&intercal;": { "codepoints": [8890], "characters": "\u22BA" },
+  "&Intersection;": { "codepoints": [8898], "characters": "\u22C2" },
+  "&intlarhk;": { "codepoints": [10775], "characters": "\u2A17" },
+  "&intprod;": { "codepoints": [10812], "characters": "\u2A3C" },
+  "&InvisibleComma;": { "codepoints": [8291], "characters": "\u2063" },
+  "&InvisibleTimes;": { "codepoints": [8290], "characters": "\u2062" },
+  "&IOcy;": { "codepoints": [1025], "characters": "\u0401" },
+  "&iocy;": { "codepoints": [1105], "characters": "\u0451" },
+  "&Iogon;": { "codepoints": [302], "characters": "\u012E" },
+  "&iogon;": { "codepoints": [303], "characters": "\u012F" },
+  "&Iopf;": { "codepoints": [120128], "characters": "\uD835\uDD40" },
+  "&iopf;": { "codepoints": [120154], "characters": "\uD835\uDD5A" },
+  "&Iota;": { "codepoints": [921], "characters": "\u0399" },
+  "&iota;": { "codepoints": [953], "characters": "\u03B9" },
+  "&iprod;": { "codepoints": [10812], "characters": "\u2A3C" },
+  "&iquest;": { "codepoints": [191], "characters": "\u00BF" },
+  "&iquest": { "codepoints": [191], "characters": "\u00BF" },
+  "&iscr;": { "codepoints": [119998], "characters": "\uD835\uDCBE" },
+  "&Iscr;": { "codepoints": [8464], "characters": "\u2110" },
+  "&isin;": { "codepoints": [8712], "characters": "\u2208" },
+  "&isindot;": { "codepoints": [8949], "characters": "\u22F5" },
+  "&isinE;": { "codepoints": [8953], "characters": "\u22F9" },
+  "&isins;": { "codepoints": [8948], "characters": "\u22F4" },
+  "&isinsv;": { "codepoints": [8947], "characters": "\u22F3" },
+  "&isinv;": { "codepoints": [8712], "characters": "\u2208" },
+  "&it;": { "codepoints": [8290], "characters": "\u2062" },
+  "&Itilde;": { "codepoints": [296], "characters": "\u0128" },
+  "&itilde;": { "codepoints": [297], "characters": "\u0129" },
+  "&Iukcy;": { "codepoints": [1030], "characters": "\u0406" },
+  "&iukcy;": { "codepoints": [1110], "characters": "\u0456" },
+  "&Iuml;": { "codepoints": [207], "characters": "\u00CF" },
+  "&Iuml": { "codepoints": [207], "characters": "\u00CF" },
+  "&iuml;": { "codepoints": [239], "characters": "\u00EF" },
+  "&iuml": { "codepoints": [239], "characters": "\u00EF" },
+  "&Jcirc;": { "codepoints": [308], "characters": "\u0134" },
+  "&jcirc;": { "codepoints": [309], "characters": "\u0135" },
+  "&Jcy;": { "codepoints": [1049], "characters": "\u0419" },
+  "&jcy;": { "codepoints": [1081], "characters": "\u0439" },
+  "&Jfr;": { "codepoints": [120077], "characters": "\uD835\uDD0D" },
+  "&jfr;": { "codepoints": [120103], "characters": "\uD835\uDD27" },
+  "&jmath;": { "codepoints": [567], "characters": "\u0237" },
+  "&Jopf;": { "codepoints": [120129], "characters": "\uD835\uDD41" },
+  "&jopf;": { "codepoints": [120155], "characters": "\uD835\uDD5B" },
+  "&Jscr;": { "codepoints": [119973], "characters": "\uD835\uDCA5" },
+  "&jscr;": { "codepoints": [119999], "characters": "\uD835\uDCBF" },
+  "&Jsercy;": { "codepoints": [1032], "characters": "\u0408" },
+  "&jsercy;": { "codepoints": [1112], "characters": "\u0458" },
+  "&Jukcy;": { "codepoints": [1028], "characters": "\u0404" },
+  "&jukcy;": { "codepoints": [1108], "characters": "\u0454" },
+  "&Kappa;": { "codepoints": [922], "characters": "\u039A" },
+  "&kappa;": { "codepoints": [954], "characters": "\u03BA" },
+  "&kappav;": { "codepoints": [1008], "characters": "\u03F0" },
+  "&Kcedil;": { "codepoints": [310], "characters": "\u0136" },
+  "&kcedil;": { "codepoints": [311], "characters": "\u0137" },
+  "&Kcy;": { "codepoints": [1050], "characters": "\u041A" },
+  "&kcy;": { "codepoints": [1082], "characters": "\u043A" },
+  "&Kfr;": { "codepoints": [120078], "characters": "\uD835\uDD0E" },
+  "&kfr;": { "codepoints": [120104], "characters": "\uD835\uDD28" },
+  "&kgreen;": { "codepoints": [312], "characters": "\u0138" },
+  "&KHcy;": { "codepoints": [1061], "characters": "\u0425" },
+  "&khcy;": { "codepoints": [1093], "characters": "\u0445" },
+  "&KJcy;": { "codepoints": [1036], "characters": "\u040C" },
+  "&kjcy;": { "codepoints": [1116], "characters": "\u045C" },
+  "&Kopf;": { "codepoints": [120130], "characters": "\uD835\uDD42" },
+  "&kopf;": { "codepoints": [120156], "characters": "\uD835\uDD5C" },
+  "&Kscr;": { "codepoints": [119974], "characters": "\uD835\uDCA6" },
+  "&kscr;": { "codepoints": [120000], "characters": "\uD835\uDCC0" },
+  "&lAarr;": { "codepoints": [8666], "characters": "\u21DA" },
+  "&Lacute;": { "codepoints": [313], "characters": "\u0139" },
+  "&lacute;": { "codepoints": [314], "characters": "\u013A" },
+  "&laemptyv;": { "codepoints": [10676], "characters": "\u29B4" },
+  "&lagran;": { "codepoints": [8466], "characters": "\u2112" },
+  "&Lambda;": { "codepoints": [923], "characters": "\u039B" },
+  "&lambda;": { "codepoints": [955], "characters": "\u03BB" },
+  "&lang;": { "codepoints": [10216], "characters": "\u27E8" },
+  "&Lang;": { "codepoints": [10218], "characters": "\u27EA" },
+  "&langd;": { "codepoints": [10641], "characters": "\u2991" },
+  "&langle;": { "codepoints": [10216], "characters": "\u27E8" },
+  "&lap;": { "codepoints": [10885], "characters": "\u2A85" },
+  "&Laplacetrf;": { "codepoints": [8466], "characters": "\u2112" },
+  "&laquo;": { "codepoints": [171], "characters": "\u00AB" },
+  "&laquo": { "codepoints": [171], "characters": "\u00AB" },
+  "&larrb;": { "codepoints": [8676], "characters": "\u21E4" },
+  "&larrbfs;": { "codepoints": [10527], "characters": "\u291F" },
+  "&larr;": { "codepoints": [8592], "characters": "\u2190" },
+  "&Larr;": { "codepoints": [8606], "characters": "\u219E" },
+  "&lArr;": { "codepoints": [8656], "characters": "\u21D0" },
+  "&larrfs;": { "codepoints": [10525], "characters": "\u291D" },
+  "&larrhk;": { "codepoints": [8617], "characters": "\u21A9" },
+  "&larrlp;": { "codepoints": [8619], "characters": "\u21AB" },
+  "&larrpl;": { "codepoints": [10553], "characters": "\u2939" },
+  "&larrsim;": { "codepoints": [10611], "characters": "\u2973" },
+  "&larrtl;": { "codepoints": [8610], "characters": "\u21A2" },
+  "&latail;": { "codepoints": [10521], "characters": "\u2919" },
+  "&lAtail;": { "codepoints": [10523], "characters": "\u291B" },
+  "&lat;": { "codepoints": [10923], "characters": "\u2AAB" },
+  "&late;": { "codepoints": [10925], "characters": "\u2AAD" },
+  "&lates;": { "codepoints": [10925, 65024], "characters": "\u2AAD\uFE00" },
+  "&lbarr;": { "codepoints": [10508], "characters": "\u290C" },
+  "&lBarr;": { "codepoints": [10510], "characters": "\u290E" },
+  "&lbbrk;": { "codepoints": [10098], "characters": "\u2772" },
+  "&lbrace;": { "codepoints": [123], "characters": "\u007B" },
+  "&lbrack;": { "codepoints": [91], "characters": "\u005B" },
+  "&lbrke;": { "codepoints": [10635], "characters": "\u298B" },
+  "&lbrksld;": { "codepoints": [10639], "characters": "\u298F" },
+  "&lbrkslu;": { "codepoints": [10637], "characters": "\u298D" },
+  "&Lcaron;": { "codepoints": [317], "characters": "\u013D" },
+  "&lcaron;": { "codepoints": [318], "characters": "\u013E" },
+  "&Lcedil;": { "codepoints": [315], "characters": "\u013B" },
+  "&lcedil;": { "codepoints": [316], "characters": "\u013C" },
+  "&lceil;": { "codepoints": [8968], "characters": "\u2308" },
+  "&lcub;": { "codepoints": [123], "characters": "\u007B" },
+  "&Lcy;": { "codepoints": [1051], "characters": "\u041B" },
+  "&lcy;": { "codepoints": [1083], "characters": "\u043B" },
+  "&ldca;": { "codepoints": [10550], "characters": "\u2936" },
+  "&ldquo;": { "codepoints": [8220], "characters": "\u201C" },
+  "&ldquor;": { "codepoints": [8222], "characters": "\u201E" },
+  "&ldrdhar;": { "codepoints": [10599], "characters": "\u2967" },
+  "&ldrushar;": { "codepoints": [10571], "characters": "\u294B" },
+  "&ldsh;": { "codepoints": [8626], "characters": "\u21B2" },
+  "&le;": { "codepoints": [8804], "characters": "\u2264" },
+  "&lE;": { "codepoints": [8806], "characters": "\u2266" },
+  "&LeftAngleBracket;": { "codepoints": [10216], "characters": "\u27E8" },
+  "&LeftArrowBar;": { "codepoints": [8676], "characters": "\u21E4" },
+  "&leftarrow;": { "codepoints": [8592], "characters": "\u2190" },
+  "&LeftArrow;": { "codepoints": [8592], "characters": "\u2190" },
+  "&Leftarrow;": { "codepoints": [8656], "characters": "\u21D0" },
+  "&LeftArrowRightArrow;": { "codepoints": [8646], "characters": "\u21C6" },
+  "&leftarrowtail;": { "codepoints": [8610], "characters": "\u21A2" },
+  "&LeftCeiling;": { "codepoints": [8968], "characters": "\u2308" },
+  "&LeftDoubleBracket;": { "codepoints": [10214], "characters": "\u27E6" },
+  "&LeftDownTeeVector;": { "codepoints": [10593], "characters": "\u2961" },
+  "&LeftDownVectorBar;": { "codepoints": [10585], "characters": "\u2959" },
+  "&LeftDownVector;": { "codepoints": [8643], "characters": "\u21C3" },
+  "&LeftFloor;": { "codepoints": [8970], "characters": "\u230A" },
+  "&leftharpoondown;": { "codepoints": [8637], "characters": "\u21BD" },
+  "&leftharpoonup;": { "codepoints": [8636], "characters": "\u21BC" },
+  "&leftleftarrows;": { "codepoints": [8647], "characters": "\u21C7" },
+  "&leftrightarrow;": { "codepoints": [8596], "characters": "\u2194" },
+  "&LeftRightArrow;": { "codepoints": [8596], "characters": "\u2194" },
+  "&Leftrightarrow;": { "codepoints": [8660], "characters": "\u21D4" },
+  "&leftrightarrows;": { "codepoints": [8646], "characters": "\u21C6" },
+  "&leftrightharpoons;": { "codepoints": [8651], "characters": "\u21CB" },
+  "&leftrightsquigarrow;": { "codepoints": [8621], "characters": "\u21AD" },
+  "&LeftRightVector;": { "codepoints": [10574], "characters": "\u294E" },
+  "&LeftTeeArrow;": { "codepoints": [8612], "characters": "\u21A4" },
+  "&LeftTee;": { "codepoints": [8867], "characters": "\u22A3" },
+  "&LeftTeeVector;": { "codepoints": [10586], "characters": "\u295A" },
+  "&leftthreetimes;": { "codepoints": [8907], "characters": "\u22CB" },
+  "&LeftTriangleBar;": { "codepoints": [10703], "characters": "\u29CF" },
+  "&LeftTriangle;": { "codepoints": [8882], "characters": "\u22B2" },
+  "&LeftTriangleEqual;": { "codepoints": [8884], "characters": "\u22B4" },
+  "&LeftUpDownVector;": { "codepoints": [10577], "characters": "\u2951" },
+  "&LeftUpTeeVector;": { "codepoints": [10592], "characters": "\u2960" },
+  "&LeftUpVectorBar;": { "codepoints": [10584], "characters": "\u2958" },
+  "&LeftUpVector;": { "codepoints": [8639], "characters": "\u21BF" },
+  "&LeftVectorBar;": { "codepoints": [10578], "characters": "\u2952" },
+  "&LeftVector;": { "codepoints": [8636], "characters": "\u21BC" },
+  "&lEg;": { "codepoints": [10891], "characters": "\u2A8B" },
+  "&leg;": { "codepoints": [8922], "characters": "\u22DA" },
+  "&leq;": { "codepoints": [8804], "characters": "\u2264" },
+  "&leqq;": { "codepoints": [8806], "characters": "\u2266" },
+  "&leqslant;": { "codepoints": [10877], "characters": "\u2A7D" },
+  "&lescc;": { "codepoints": [10920], "characters": "\u2AA8" },
+  "&les;": { "codepoints": [10877], "characters": "\u2A7D" },
+  "&lesdot;": { "codepoints": [10879], "characters": "\u2A7F" },
+  "&lesdoto;": { "codepoints": [10881], "characters": "\u2A81" },
+  "&lesdotor;": { "codepoints": [10883], "characters": "\u2A83" },
+  "&lesg;": { "codepoints": [8922, 65024], "characters": "\u22DA\uFE00" },
+  "&lesges;": { "codepoints": [10899], "characters": "\u2A93" },
+  "&lessapprox;": { "codepoints": [10885], "characters": "\u2A85" },
+  "&lessdot;": { "codepoints": [8918], "characters": "\u22D6" },
+  "&lesseqgtr;": { "codepoints": [8922], "characters": "\u22DA" },
+  "&lesseqqgtr;": { "codepoints": [10891], "characters": "\u2A8B" },
+  "&LessEqualGreater;": { "codepoints": [8922], "characters": "\u22DA" },
+  "&LessFullEqual;": { "codepoints": [8806], "characters": "\u2266" },
+  "&LessGreater;": { "codepoints": [8822], "characters": "\u2276" },
+  "&lessgtr;": { "codepoints": [8822], "characters": "\u2276" },
+  "&LessLess;": { "codepoints": [10913], "characters": "\u2AA1" },
+  "&lesssim;": { "codepoints": [8818], "characters": "\u2272" },
+  "&LessSlantEqual;": { "codepoints": [10877], "characters": "\u2A7D" },
+  "&LessTilde;": { "codepoints": [8818], "characters": "\u2272" },
+  "&lfisht;": { "codepoints": [10620], "characters": "\u297C" },
+  "&lfloor;": { "codepoints": [8970], "characters": "\u230A" },
+  "&Lfr;": { "codepoints": [120079], "characters": "\uD835\uDD0F" },
+  "&lfr;": { "codepoints": [120105], "characters": "\uD835\uDD29" },
+  "&lg;": { "codepoints": [8822], "characters": "\u2276" },
+  "&lgE;": { "codepoints": [10897], "characters": "\u2A91" },
+  "&lHar;": { "codepoints": [10594], "characters": "\u2962" },
+  "&lhard;": { "codepoints": [8637], "characters": "\u21BD" },
+  "&lharu;": { "codepoints": [8636], "characters": "\u21BC" },
+  "&lharul;": { "codepoints": [10602], "characters": "\u296A" },
+  "&lhblk;": { "codepoints": [9604], "characters": "\u2584" },
+  "&LJcy;": { "codepoints": [1033], "characters": "\u0409" },
+  "&ljcy;": { "codepoints": [1113], "characters": "\u0459" },
+  "&llarr;": { "codepoints": [8647], "characters": "\u21C7" },
+  "&ll;": { "codepoints": [8810], "characters": "\u226A" },
+  "&Ll;": { "codepoints": [8920], "characters": "\u22D8" },
+  "&llcorner;": { "codepoints": [8990], "characters": "\u231E" },
+  "&Lleftarrow;": { "codepoints": [8666], "characters": "\u21DA" },
+  "&llhard;": { "codepoints": [10603], "characters": "\u296B" },
+  "&lltri;": { "codepoints": [9722], "characters": "\u25FA" },
+  "&Lmidot;": { "codepoints": [319], "characters": "\u013F" },
+  "&lmidot;": { "codepoints": [320], "characters": "\u0140" },
+  "&lmoustache;": { "codepoints": [9136], "characters": "\u23B0" },
+  "&lmoust;": { "codepoints": [9136], "characters": "\u23B0" },
+  "&lnap;": { "codepoints": [10889], "characters": "\u2A89" },
+  "&lnapprox;": { "codepoints": [10889], "characters": "\u2A89" },
+  "&lne;": { "codepoints": [10887], "characters": "\u2A87" },
+  "&lnE;": { "codepoints": [8808], "characters": "\u2268" },
+  "&lneq;": { "codepoints": [10887], "characters": "\u2A87" },
+  "&lneqq;": { "codepoints": [8808], "characters": "\u2268" },
+  "&lnsim;": { "codepoints": [8934], "characters": "\u22E6" },
+  "&loang;": { "codepoints": [10220], "characters": "\u27EC" },
+  "&loarr;": { "codepoints": [8701], "characters": "\u21FD" },
+  "&lobrk;": { "codepoints": [10214], "characters": "\u27E6" },
+  "&longleftarrow;": { "codepoints": [10229], "characters": "\u27F5" },
+  "&LongLeftArrow;": { "codepoints": [10229], "characters": "\u27F5" },
+  "&Longleftarrow;": { "codepoints": [10232], "characters": "\u27F8" },
+  "&longleftrightarrow;": { "codepoints": [10231], "characters": "\u27F7" },
+  "&LongLeftRightArrow;": { "codepoints": [10231], "characters": "\u27F7" },
+  "&Longleftrightarrow;": { "codepoints": [10234], "characters": "\u27FA" },
+  "&longmapsto;": { "codepoints": [10236], "characters": "\u27FC" },
+  "&longrightarrow;": { "codepoints": [10230], "characters": "\u27F6" },
+  "&LongRightArrow;": { "codepoints": [10230], "characters": "\u27F6" },
+  "&Longrightarrow;": { "codepoints": [10233], "characters": "\u27F9" },
+  "&looparrowleft;": { "codepoints": [8619], "characters": "\u21AB" },
+  "&looparrowright;": { "codepoints": [8620], "characters": "\u21AC" },
+  "&lopar;": { "codepoints": [10629], "characters": "\u2985" },
+  "&Lopf;": { "codepoints": [120131], "characters": "\uD835\uDD43" },
+  "&lopf;": { "codepoints": [120157], "characters": "\uD835\uDD5D" },
+  "&loplus;": { "codepoints": [10797], "characters": "\u2A2D" },
+  "&lotimes;": { "codepoints": [10804], "characters": "\u2A34" },
+  "&lowast;": { "codepoints": [8727], "characters": "\u2217" },
+  "&lowbar;": { "codepoints": [95], "characters": "\u005F" },
+  "&LowerLeftArrow;": { "codepoints": [8601], "characters": "\u2199" },
+  "&LowerRightArrow;": { "codepoints": [8600], "characters": "\u2198" },
+  "&loz;": { "codepoints": [9674], "characters": "\u25CA" },
+  "&lozenge;": { "codepoints": [9674], "characters": "\u25CA" },
+  "&lozf;": { "codepoints": [10731], "characters": "\u29EB" },
+  "&lpar;": { "codepoints": [40], "characters": "\u0028" },
+  "&lparlt;": { "codepoints": [10643], "characters": "\u2993" },
+  "&lrarr;": { "codepoints": [8646], "characters": "\u21C6" },
+  "&lrcorner;": { "codepoints": [8991], "characters": "\u231F" },
+  "&lrhar;": { "codepoints": [8651], "characters": "\u21CB" },
+  "&lrhard;": { "codepoints": [10605], "characters": "\u296D" },
+  "&lrm;": { "codepoints": [8206], "characters": "\u200E" },
+  "&lrtri;": { "codepoints": [8895], "characters": "\u22BF" },
+  "&lsaquo;": { "codepoints": [8249], "characters": "\u2039" },
+  "&lscr;": { "codepoints": [120001], "characters": "\uD835\uDCC1" },
+  "&Lscr;": { "codepoints": [8466], "characters": "\u2112" },
+  "&lsh;": { "codepoints": [8624], "characters": "\u21B0" },
+  "&Lsh;": { "codepoints": [8624], "characters": "\u21B0" },
+  "&lsim;": { "codepoints": [8818], "characters": "\u2272" },
+  "&lsime;": { "codepoints": [10893], "characters": "\u2A8D" },
+  "&lsimg;": { "codepoints": [10895], "characters": "\u2A8F" },
+  "&lsqb;": { "codepoints": [91], "characters": "\u005B" },
+  "&lsquo;": { "codepoints": [8216], "characters": "\u2018" },
+  "&lsquor;": { "codepoints": [8218], "characters": "\u201A" },
+  "&Lstrok;": { "codepoints": [321], "characters": "\u0141" },
+  "&lstrok;": { "codepoints": [322], "characters": "\u0142" },
+  "&ltcc;": { "codepoints": [10918], "characters": "\u2AA6" },
+  "&ltcir;": { "codepoints": [10873], "characters": "\u2A79" },
+  "&lt;": { "codepoints": [60], "characters": "\u003C" },
+  "&lt": { "codepoints": [60], "characters": "\u003C" },
+  "&LT;": { "codepoints": [60], "characters": "\u003C" },
+  "&LT": { "codepoints": [60], "characters": "\u003C" },
+  "&Lt;": { "codepoints": [8810], "characters": "\u226A" },
+  "&ltdot;": { "codepoints": [8918], "characters": "\u22D6" },
+  "&lthree;": { "codepoints": [8907], "characters": "\u22CB" },
+  "&ltimes;": { "codepoints": [8905], "characters": "\u22C9" },
+  "&ltlarr;": { "codepoints": [10614], "characters": "\u2976" },
+  "&ltquest;": { "codepoints": [10875], "characters": "\u2A7B" },
+  "&ltri;": { "codepoints": [9667], "characters": "\u25C3" },
+  "&ltrie;": { "codepoints": [8884], "characters": "\u22B4" },
+  "&ltrif;": { "codepoints": [9666], "characters": "\u25C2" },
+  "&ltrPar;": { "codepoints": [10646], "characters": "\u2996" },
+  "&lurdshar;": { "codepoints": [10570], "characters": "\u294A" },
+  "&luruhar;": { "codepoints": [10598], "characters": "\u2966" },
+  "&lvertneqq;": { "codepoints": [8808, 65024], "characters": "\u2268\uFE00" },
+  "&lvnE;": { "codepoints": [8808, 65024], "characters": "\u2268\uFE00" },
+  "&macr;": { "codepoints": [175], "characters": "\u00AF" },
+  "&macr": { "codepoints": [175], "characters": "\u00AF" },
+  "&male;": { "codepoints": [9794], "characters": "\u2642" },
+  "&malt;": { "codepoints": [10016], "characters": "\u2720" },
+  "&maltese;": { "codepoints": [10016], "characters": "\u2720" },
+  "&Map;": { "codepoints": [10501], "characters": "\u2905" },
+  "&map;": { "codepoints": [8614], "characters": "\u21A6" },
+  "&mapsto;": { "codepoints": [8614], "characters": "\u21A6" },
+  "&mapstodown;": { "codepoints": [8615], "characters": "\u21A7" },
+  "&mapstoleft;": { "codepoints": [8612], "characters": "\u21A4" },
+  "&mapstoup;": { "codepoints": [8613], "characters": "\u21A5" },
+  "&marker;": { "codepoints": [9646], "characters": "\u25AE" },
+  "&mcomma;": { "codepoints": [10793], "characters": "\u2A29" },
+  "&Mcy;": { "codepoints": [1052], "characters": "\u041C" },
+  "&mcy;": { "codepoints": [1084], "characters": "\u043C" },
+  "&mdash;": { "codepoints": [8212], "characters": "\u2014" },
+  "&mDDot;": { "codepoints": [8762], "characters": "\u223A" },
+  "&measuredangle;": { "codepoints": [8737], "characters": "\u2221" },
+  "&MediumSpace;": { "codepoints": [8287], "characters": "\u205F" },
+  "&Mellintrf;": { "codepoints": [8499], "characters": "\u2133" },
+  "&Mfr;": { "codepoints": [120080], "characters": "\uD835\uDD10" },
+  "&mfr;": { "codepoints": [120106], "characters": "\uD835\uDD2A" },
+  "&mho;": { "codepoints": [8487], "characters": "\u2127" },
+  "&micro;": { "codepoints": [181], "characters": "\u00B5" },
+  "&micro": { "codepoints": [181], "characters": "\u00B5" },
+  "&midast;": { "codepoints": [42], "characters": "\u002A" },
+  "&midcir;": { "codepoints": [10992], "characters": "\u2AF0" },
+  "&mid;": { "codepoints": [8739], "characters": "\u2223" },
+  "&middot;": { "codepoints": [183], "characters": "\u00B7" },
+  "&middot": { "codepoints": [183], "characters": "\u00B7" },
+  "&minusb;": { "codepoints": [8863], "characters": "\u229F" },
+  "&minus;": { "codepoints": [8722], "characters": "\u2212" },
+  "&minusd;": { "codepoints": [8760], "characters": "\u2238" },
+  "&minusdu;": { "codepoints": [10794], "characters": "\u2A2A" },
+  "&MinusPlus;": { "codepoints": [8723], "characters": "\u2213" },
+  "&mlcp;": { "codepoints": [10971], "characters": "\u2ADB" },
+  "&mldr;": { "codepoints": [8230], "characters": "\u2026" },
+  "&mnplus;": { "codepoints": [8723], "characters": "\u2213" },
+  "&models;": { "codepoints": [8871], "characters": "\u22A7" },
+  "&Mopf;": { "codepoints": [120132], "characters": "\uD835\uDD44" },
+  "&mopf;": { "codepoints": [120158], "characters": "\uD835\uDD5E" },
+  "&mp;": { "codepoints": [8723], "characters": "\u2213" },
+  "&mscr;": { "codepoints": [120002], "characters": "\uD835\uDCC2" },
+  "&Mscr;": { "codepoints": [8499], "characters": "\u2133" },
+  "&mstpos;": { "codepoints": [8766], "characters": "\u223E" },
+  "&Mu;": { "codepoints": [924], "characters": "\u039C" },
+  "&mu;": { "codepoints": [956], "characters": "\u03BC" },
+  "&multimap;": { "codepoints": [8888], "characters": "\u22B8" },
+  "&mumap;": { "codepoints": [8888], "characters": "\u22B8" },
+  "&nabla;": { "codepoints": [8711], "characters": "\u2207" },
+  "&Nacute;": { "codepoints": [323], "characters": "\u0143" },
+  "&nacute;": { "codepoints": [324], "characters": "\u0144" },
+  "&nang;": { "codepoints": [8736, 8402], "characters": "\u2220\u20D2" },
+  "&nap;": { "codepoints": [8777], "characters": "\u2249" },
+  "&napE;": { "codepoints": [10864, 824], "characters": "\u2A70\u0338" },
+  "&napid;": { "codepoints": [8779, 824], "characters": "\u224B\u0338" },
+  "&napos;": { "codepoints": [329], "characters": "\u0149" },
+  "&napprox;": { "codepoints": [8777], "characters": "\u2249" },
+  "&natural;": { "codepoints": [9838], "characters": "\u266E" },
+  "&naturals;": { "codepoints": [8469], "characters": "\u2115" },
+  "&natur;": { "codepoints": [9838], "characters": "\u266E" },
+  "&nbsp;": { "codepoints": [160], "characters": "\u00A0" },
+  "&nbsp": { "codepoints": [160], "characters": "\u00A0" },
+  "&nbump;": { "codepoints": [8782, 824], "characters": "\u224E\u0338" },
+  "&nbumpe;": { "codepoints": [8783, 824], "characters": "\u224F\u0338" },
+  "&ncap;": { "codepoints": [10819], "characters": "\u2A43" },
+  "&Ncaron;": { "codepoints": [327], "characters": "\u0147" },
+  "&ncaron;": { "codepoints": [328], "characters": "\u0148" },
+  "&Ncedil;": { "codepoints": [325], "characters": "\u0145" },
+  "&ncedil;": { "codepoints": [326], "characters": "\u0146" },
+  "&ncong;": { "codepoints": [8775], "characters": "\u2247" },
+  "&ncongdot;": { "codepoints": [10861, 824], "characters": "\u2A6D\u0338" },
+  "&ncup;": { "codepoints": [10818], "characters": "\u2A42" },
+  "&Ncy;": { "codepoints": [1053], "characters": "\u041D" },
+  "&ncy;": { "codepoints": [1085], "characters": "\u043D" },
+  "&ndash;": { "codepoints": [8211], "characters": "\u2013" },
+  "&nearhk;": { "codepoints": [10532], "characters": "\u2924" },
+  "&nearr;": { "codepoints": [8599], "characters": "\u2197" },
+  "&neArr;": { "codepoints": [8663], "characters": "\u21D7" },
+  "&nearrow;": { "codepoints": [8599], "characters": "\u2197" },
+  "&ne;": { "codepoints": [8800], "characters": "\u2260" },
+  "&nedot;": { "codepoints": [8784, 824], "characters": "\u2250\u0338" },
+  "&NegativeMediumSpace;": { "codepoints": [8203], "characters": "\u200B" },
+  "&NegativeThickSpace;": { "codepoints": [8203], "characters": "\u200B" },
+  "&NegativeThinSpace;": { "codepoints": [8203], "characters": "\u200B" },
+  "&NegativeVeryThinSpace;": { "codepoints": [8203], "characters": "\u200B" },
+  "&nequiv;": { "codepoints": [8802], "characters": "\u2262" },
+  "&nesear;": { "codepoints": [10536], "characters": "\u2928" },
+  "&nesim;": { "codepoints": [8770, 824], "characters": "\u2242\u0338" },
+  "&NestedGreaterGreater;": { "codepoints": [8811], "characters": "\u226B" },
+  "&NestedLessLess;": { "codepoints": [8810], "characters": "\u226A" },
+  "&NewLine;": { "codepoints": [10], "characters": "\u000A" },
+  "&nexist;": { "codepoints": [8708], "characters": "\u2204" },
+  "&nexists;": { "codepoints": [8708], "characters": "\u2204" },
+  "&Nfr;": { "codepoints": [120081], "characters": "\uD835\uDD11" },
+  "&nfr;": { "codepoints": [120107], "characters": "\uD835\uDD2B" },
+  "&ngE;": { "codepoints": [8807, 824], "characters": "\u2267\u0338" },
+  "&nge;": { "codepoints": [8817], "characters": "\u2271" },
+  "&ngeq;": { "codepoints": [8817], "characters": "\u2271" },
+  "&ngeqq;": { "codepoints": [8807, 824], "characters": "\u2267\u0338" },
+  "&ngeqslant;": { "codepoints": [10878, 824], "characters": "\u2A7E\u0338" },
+  "&nges;": { "codepoints": [10878, 824], "characters": "\u2A7E\u0338" },
+  "&nGg;": { "codepoints": [8921, 824], "characters": "\u22D9\u0338" },
+  "&ngsim;": { "codepoints": [8821], "characters": "\u2275" },
+  "&nGt;": { "codepoints": [8811, 8402], "characters": "\u226B\u20D2" },
+  "&ngt;": { "codepoints": [8815], "characters": "\u226F" },
+  "&ngtr;": { "codepoints": [8815], "characters": "\u226F" },
+  "&nGtv;": { "codepoints": [8811, 824], "characters": "\u226B\u0338" },
+  "&nharr;": { "codepoints": [8622], "characters": "\u21AE" },
+  "&nhArr;": { "codepoints": [8654], "characters": "\u21CE" },
+  "&nhpar;": { "codepoints": [10994], "characters": "\u2AF2" },
+  "&ni;": { "codepoints": [8715], "characters": "\u220B" },
+  "&nis;": { "codepoints": [8956], "characters": "\u22FC" },
+  "&nisd;": { "codepoints": [8954], "characters": "\u22FA" },
+  "&niv;": { "codepoints": [8715], "characters": "\u220B" },
+  "&NJcy;": { "codepoints": [1034], "characters": "\u040A" },
+  "&njcy;": { "codepoints": [1114], "characters": "\u045A" },
+  "&nlarr;": { "codepoints": [8602], "characters": "\u219A" },
+  "&nlArr;": { "codepoints": [8653], "characters": "\u21CD" },
+  "&nldr;": { "codepoints": [8229], "characters": "\u2025" },
+  "&nlE;": { "codepoints": [8806, 824], "characters": "\u2266\u0338" },
+  "&nle;": { "codepoints": [8816], "characters": "\u2270" },
+  "&nleftarrow;": { "codepoints": [8602], "characters": "\u219A" },
+  "&nLeftarrow;": { "codepoints": [8653], "characters": "\u21CD" },
+  "&nleftrightarrow;": { "codepoints": [8622], "characters": "\u21AE" },
+  "&nLeftrightarrow;": { "codepoints": [8654], "characters": "\u21CE" },
+  "&nleq;": { "codepoints": [8816], "characters": "\u2270" },
+  "&nleqq;": { "codepoints": [8806, 824], "characters": "\u2266\u0338" },
+  "&nleqslant;": { "codepoints": [10877, 824], "characters": "\u2A7D\u0338" },
+  "&nles;": { "codepoints": [10877, 824], "characters": "\u2A7D\u0338" },
+  "&nless;": { "codepoints": [8814], "characters": "\u226E" },
+  "&nLl;": { "codepoints": [8920, 824], "characters": "\u22D8\u0338" },
+  "&nlsim;": { "codepoints": [8820], "characters": "\u2274" },
+  "&nLt;": { "codepoints": [8810, 8402], "characters": "\u226A\u20D2" },
+  "&nlt;": { "codepoints": [8814], "characters": "\u226E" },
+  "&nltri;": { "codepoints": [8938], "characters": "\u22EA" },
+  "&nltrie;": { "codepoints": [8940], "characters": "\u22EC" },
+  "&nLtv;": { "codepoints": [8810, 824], "characters": "\u226A\u0338" },
+  "&nmid;": { "codepoints": [8740], "characters": "\u2224" },
+  "&NoBreak;": { "codepoints": [8288], "characters": "\u2060" },
+  "&NonBreakingSpace;": { "codepoints": [160], "characters": "\u00A0" },
+  "&nopf;": { "codepoints": [120159], "characters": "\uD835\uDD5F" },
+  "&Nopf;": { "codepoints": [8469], "characters": "\u2115" },
+  "&Not;": { "codepoints": [10988], "characters": "\u2AEC" },
+  "&not;": { "codepoints": [172], "characters": "\u00AC" },
+  "&not": { "codepoints": [172], "characters": "\u00AC" },
+  "&NotCongruent;": { "codepoints": [8802], "characters": "\u2262" },
+  "&NotCupCap;": { "codepoints": [8813], "characters": "\u226D" },
+  "&NotDoubleVerticalBar;": { "codepoints": [8742], "characters": "\u2226" },
+  "&NotElement;": { "codepoints": [8713], "characters": "\u2209" },
+  "&NotEqual;": { "codepoints": [8800], "characters": "\u2260" },
+  "&NotEqualTilde;": { "codepoints": [8770, 824], "characters": "\u2242\u0338" },
+  "&NotExists;": { "codepoints": [8708], "characters": "\u2204" },
+  "&NotGreater;": { "codepoints": [8815], "characters": "\u226F" },
+  "&NotGreaterEqual;": { "codepoints": [8817], "characters": "\u2271" },
+  "&NotGreaterFullEqual;": { "codepoints": [8807, 824], "characters": "\u2267\u0338" },
+  "&NotGreaterGreater;": { "codepoints": [8811, 824], "characters": "\u226B\u0338" },
+  "&NotGreaterLess;": { "codepoints": [8825], "characters": "\u2279" },
+  "&NotGreaterSlantEqual;": { "codepoints": [10878, 824], "characters": "\u2A7E\u0338" },
+  "&NotGreaterTilde;": { "codepoints": [8821], "characters": "\u2275" },
+  "&NotHumpDownHump;": { "codepoints": [8782, 824], "characters": "\u224E\u0338" },
+  "&NotHumpEqual;": { "codepoints": [8783, 824], "characters": "\u224F\u0338" },
+  "&notin;": { "codepoints": [8713], "characters": "\u2209" },
+  "&notindot;": { "codepoints": [8949, 824], "characters": "\u22F5\u0338" },
+  "&notinE;": { "codepoints": [8953, 824], "characters": "\u22F9\u0338" },
+  "&notinva;": { "codepoints": [8713], "characters": "\u2209" },
+  "&notinvb;": { "codepoints": [8951], "characters": "\u22F7" },
+  "&notinvc;": { "codepoints": [8950], "characters": "\u22F6" },
+  "&NotLeftTriangleBar;": { "codepoints": [10703, 824], "characters": "\u29CF\u0338" },
+  "&NotLeftTriangle;": { "codepoints": [8938], "characters": "\u22EA" },
+  "&NotLeftTriangleEqual;": { "codepoints": [8940], "characters": "\u22EC" },
+  "&NotLess;": { "codepoints": [8814], "characters": "\u226E" },
+  "&NotLessEqual;": { "codepoints": [8816], "characters": "\u2270" },
+  "&NotLessGreater;": { "codepoints": [8824], "characters": "\u2278" },
+  "&NotLessLess;": { "codepoints": [8810, 824], "characters": "\u226A\u0338" },
+  "&NotLessSlantEqual;": { "codepoints": [10877, 824], "characters": "\u2A7D\u0338" },
+  "&NotLessTilde;": { "codepoints": [8820], "characters": "\u2274" },
+  "&NotNestedGreaterGreater;": { "codepoints": [10914, 824], "characters": "\u2AA2\u0338" },
+  "&NotNestedLessLess;": { "codepoints": [10913, 824], "characters": "\u2AA1\u0338" },
+  "&notni;": { "codepoints": [8716], "characters": "\u220C" },
+  "&notniva;": { "codepoints": [8716], "characters": "\u220C" },
+  "&notnivb;": { "codepoints": [8958], "characters": "\u22FE" },
+  "&notnivc;": { "codepoints": [8957], "characters": "\u22FD" },
+  "&NotPrecedes;": { "codepoints": [8832], "characters": "\u2280" },
+  "&NotPrecedesEqual;": { "codepoints": [10927, 824], "characters": "\u2AAF\u0338" },
+  "&NotPrecedesSlantEqual;": { "codepoints": [8928], "characters": "\u22E0" },
+  "&NotReverseElement;": { "codepoints": [8716], "characters": "\u220C" },
+  "&NotRightTriangleBar;": { "codepoints": [10704, 824], "characters": "\u29D0\u0338" },
+  "&NotRightTriangle;": { "codepoints": [8939], "characters": "\u22EB" },
+  "&NotRightTriangleEqual;": { "codepoints": [8941], "characters": "\u22ED" },
+  "&NotSquareSubset;": { "codepoints": [8847, 824], "characters": "\u228F\u0338" },
+  "&NotSquareSubsetEqual;": { "codepoints": [8930], "characters": "\u22E2" },
+  "&NotSquareSuperset;": { "codepoints": [8848, 824], "characters": "\u2290\u0338" },
+  "&NotSquareSupersetEqual;": { "codepoints": [8931], "characters": "\u22E3" },
+  "&NotSubset;": { "codepoints": [8834, 8402], "characters": "\u2282\u20D2" },
+  "&NotSubsetEqual;": { "codepoints": [8840], "characters": "\u2288" },
+  "&NotSucceeds;": { "codepoints": [8833], "characters": "\u2281" },
+  "&NotSucceedsEqual;": { "codepoints": [10928, 824], "characters": "\u2AB0\u0338" },
+  "&NotSucceedsSlantEqual;": { "codepoints": [8929], "characters": "\u22E1" },
+  "&NotSucceedsTilde;": { "codepoints": [8831, 824], "characters": "\u227F\u0338" },
+  "&NotSuperset;": { "codepoints": [8835, 8402], "characters": "\u2283\u20D2" },
+  "&NotSupersetEqual;": { "codepoints": [8841], "characters": "\u2289" },
+  "&NotTilde;": { "codepoints": [8769], "characters": "\u2241" },
+  "&NotTildeEqual;": { "codepoints": [8772], "characters": "\u2244" },
+  "&NotTildeFullEqual;": { "codepoints": [8775], "characters": "\u2247" },
+  "&NotTildeTilde;": { "codepoints": [8777], "characters": "\u2249" },
+  "&NotVerticalBar;": { "codepoints": [8740], "characters": "\u2224" },
+  "&nparallel;": { "codepoints": [8742], "characters": "\u2226" },
+  "&npar;": { "codepoints": [8742], "characters": "\u2226" },
+  "&nparsl;": { "codepoints": [11005, 8421], "characters": "\u2AFD\u20E5" },
+  "&npart;": { "codepoints": [8706, 824], "characters": "\u2202\u0338" },
+  "&npolint;": { "codepoints": [10772], "characters": "\u2A14" },
+  "&npr;": { "codepoints": [8832], "characters": "\u2280" },
+  "&nprcue;": { "codepoints": [8928], "characters": "\u22E0" },
+  "&nprec;": { "codepoints": [8832], "characters": "\u2280" },
+  "&npreceq;": { "codepoints": [10927, 824], "characters": "\u2AAF\u0338" },
+  "&npre;": { "codepoints": [10927, 824], "characters": "\u2AAF\u0338" },
+  "&nrarrc;": { "codepoints": [10547, 824], "characters": "\u2933\u0338" },
+  "&nrarr;": { "codepoints": [8603], "characters": "\u219B" },
+  "&nrArr;": { "codepoints": [8655], "characters": "\u21CF" },
+  "&nrarrw;": { "codepoints": [8605, 824], "characters": "\u219D\u0338" },
+  "&nrightarrow;": { "codepoints": [8603], "characters": "\u219B" },
+  "&nRightarrow;": { "codepoints": [8655], "characters": "\u21CF" },
+  "&nrtri;": { "codepoints": [8939], "characters": "\u22EB" },
+  "&nrtrie;": { "codepoints": [8941], "characters": "\u22ED" },
+  "&nsc;": { "codepoints": [8833], "characters": "\u2281" },
+  "&nsccue;": { "codepoints": [8929], "characters": "\u22E1" },
+  "&nsce;": { "codepoints": [10928, 824], "characters": "\u2AB0\u0338" },
+  "&Nscr;": { "codepoints": [119977], "characters": "\uD835\uDCA9" },
+  "&nscr;": { "codepoints": [120003], "characters": "\uD835\uDCC3" },
+  "&nshortmid;": { "codepoints": [8740], "characters": "\u2224" },
+  "&nshortparallel;": { "codepoints": [8742], "characters": "\u2226" },
+  "&nsim;": { "codepoints": [8769], "characters": "\u2241" },
+  "&nsime;": { "codepoints": [8772], "characters": "\u2244" },
+  "&nsimeq;": { "codepoints": [8772], "characters": "\u2244" },
+  "&nsmid;": { "codepoints": [8740], "characters": "\u2224" },
+  "&nspar;": { "codepoints": [8742], "characters": "\u2226" },
+  "&nsqsube;": { "codepoints": [8930], "characters": "\u22E2" },
+  "&nsqsupe;": { "codepoints": [8931], "characters": "\u22E3" },
+  "&nsub;": { "codepoints": [8836], "characters": "\u2284" },
+  "&nsubE;": { "codepoints": [10949, 824], "characters": "\u2AC5\u0338" },
+  "&nsube;": { "codepoints": [8840], "characters": "\u2288" },
+  "&nsubset;": { "codepoints": [8834, 8402], "characters": "\u2282\u20D2" },
+  "&nsubseteq;": { "codepoints": [8840], "characters": "\u2288" },
+  "&nsubseteqq;": { "codepoints": [10949, 824], "characters": "\u2AC5\u0338" },
+  "&nsucc;": { "codepoints": [8833], "characters": "\u2281" },
+  "&nsucceq;": { "codepoints": [10928, 824], "characters": "\u2AB0\u0338" },
+  "&nsup;": { "codepoints": [8837], "characters": "\u2285" },
+  "&nsupE;": { "codepoints": [10950, 824], "characters": "\u2AC6\u0338" },
+  "&nsupe;": { "codepoints": [8841], "characters": "\u2289" },
+  "&nsupset;": { "codepoints": [8835, 8402], "characters": "\u2283\u20D2" },
+  "&nsupseteq;": { "codepoints": [8841], "characters": "\u2289" },
+  "&nsupseteqq;": { "codepoints": [10950, 824], "characters": "\u2AC6\u0338" },
+  "&ntgl;": { "codepoints": [8825], "characters": "\u2279" },
+  "&Ntilde;": { "codepoints": [209], "characters": "\u00D1" },
+  "&Ntilde": { "codepoints": [209], "characters": "\u00D1" },
+  "&ntilde;": { "codepoints": [241], "characters": "\u00F1" },
+  "&ntilde": { "codepoints": [241], "characters": "\u00F1" },
+  "&ntlg;": { "codepoints": [8824], "characters": "\u2278" },
+  "&ntriangleleft;": { "codepoints": [8938], "characters": "\u22EA" },
+  "&ntrianglelefteq;": { "codepoints": [8940], "characters": "\u22EC" },
+  "&ntriangleright;": { "codepoints": [8939], "characters": "\u22EB" },
+  "&ntrianglerighteq;": { "codepoints": [8941], "characters": "\u22ED" },
+  "&Nu;": { "codepoints": [925], "characters": "\u039D" },
+  "&nu;": { "codepoints": [957], "characters": "\u03BD" },
+  "&num;": { "codepoints": [35], "characters": "\u0023" },
+  "&numero;": { "codepoints": [8470], "characters": "\u2116" },
+  "&numsp;": { "codepoints": [8199], "characters": "\u2007" },
+  "&nvap;": { "codepoints": [8781, 8402], "characters": "\u224D\u20D2" },
+  "&nvdash;": { "codepoints": [8876], "characters": "\u22AC" },
+  "&nvDash;": { "codepoints": [8877], "characters": "\u22AD" },
+  "&nVdash;": { "codepoints": [8878], "characters": "\u22AE" },
+  "&nVDash;": { "codepoints": [8879], "characters": "\u22AF" },
+  "&nvge;": { "codepoints": [8805, 8402], "characters": "\u2265\u20D2" },
+  "&nvgt;": { "codepoints": [62, 8402], "characters": "\u003E\u20D2" },
+  "&nvHarr;": { "codepoints": [10500], "characters": "\u2904" },
+  "&nvinfin;": { "codepoints": [10718], "characters": "\u29DE" },
+  "&nvlArr;": { "codepoints": [10498], "characters": "\u2902" },
+  "&nvle;": { "codepoints": [8804, 8402], "characters": "\u2264\u20D2" },
+  "&nvlt;": { "codepoints": [60, 8402], "characters": "\u003C\u20D2" },
+  "&nvltrie;": { "codepoints": [8884, 8402], "characters": "\u22B4\u20D2" },
+  "&nvrArr;": { "codepoints": [10499], "characters": "\u2903" },
+  "&nvrtrie;": { "codepoints": [8885, 8402], "characters": "\u22B5\u20D2" },
+  "&nvsim;": { "codepoints": [8764, 8402], "characters": "\u223C\u20D2" },
+  "&nwarhk;": { "codepoints": [10531], "characters": "\u2923" },
+  "&nwarr;": { "codepoints": [8598], "characters": "\u2196" },
+  "&nwArr;": { "codepoints": [8662], "characters": "\u21D6" },
+  "&nwarrow;": { "codepoints": [8598], "characters": "\u2196" },
+  "&nwnear;": { "codepoints": [10535], "characters": "\u2927" },
+  "&Oacute;": { "codepoints": [211], "characters": "\u00D3" },
+  "&Oacute": { "codepoints": [211], "characters": "\u00D3" },
+  "&oacute;": { "codepoints": [243], "characters": "\u00F3" },
+  "&oacute": { "codepoints": [243], "characters": "\u00F3" },
+  "&oast;": { "codepoints": [8859], "characters": "\u229B" },
+  "&Ocirc;": { "codepoints": [212], "characters": "\u00D4" },
+  "&Ocirc": { "codepoints": [212], "characters": "\u00D4" },
+  "&ocirc;": { "codepoints": [244], "characters": "\u00F4" },
+  "&ocirc": { "codepoints": [244], "characters": "\u00F4" },
+  "&ocir;": { "codepoints": [8858], "characters": "\u229A" },
+  "&Ocy;": { "codepoints": [1054], "characters": "\u041E" },
+  "&ocy;": { "codepoints": [1086], "characters": "\u043E" },
+  "&odash;": { "codepoints": [8861], "characters": "\u229D" },
+  "&Odblac;": { "codepoints": [336], "characters": "\u0150" },
+  "&odblac;": { "codepoints": [337], "characters": "\u0151" },
+  "&odiv;": { "codepoints": [10808], "characters": "\u2A38" },
+  "&odot;": { "codepoints": [8857], "characters": "\u2299" },
+  "&odsold;": { "codepoints": [10684], "characters": "\u29BC" },
+  "&OElig;": { "codepoints": [338], "characters": "\u0152" },
+  "&oelig;": { "codepoints": [339], "characters": "\u0153" },
+  "&ofcir;": { "codepoints": [10687], "characters": "\u29BF" },
+  "&Ofr;": { "codepoints": [120082], "characters": "\uD835\uDD12" },
+  "&ofr;": { "codepoints": [120108], "characters": "\uD835\uDD2C" },
+  "&ogon;": { "codepoints": [731], "characters": "\u02DB" },
+  "&Ograve;": { "codepoints": [210], "characters": "\u00D2" },
+  "&Ograve": { "codepoints": [210], "characters": "\u00D2" },
+  "&ograve;": { "codepoints": [242], "characters": "\u00F2" },
+  "&ograve": { "codepoints": [242], "characters": "\u00F2" },
+  "&ogt;": { "codepoints": [10689], "characters": "\u29C1" },
+  "&ohbar;": { "codepoints": [10677], "characters": "\u29B5" },
+  "&ohm;": { "codepoints": [937], "characters": "\u03A9" },
+  "&oint;": { "codepoints": [8750], "characters": "\u222E" },
+  "&olarr;": { "codepoints": [8634], "characters": "\u21BA" },
+  "&olcir;": { "codepoints": [10686], "characters": "\u29BE" },
+  "&olcross;": { "codepoints": [10683], "characters": "\u29BB" },
+  "&oline;": { "codepoints": [8254], "characters": "\u203E" },
+  "&olt;": { "codepoints": [10688], "characters": "\u29C0" },
+  "&Omacr;": { "codepoints": [332], "characters": "\u014C" },
+  "&omacr;": { "codepoints": [333], "characters": "\u014D" },
+  "&Omega;": { "codepoints": [937], "characters": "\u03A9" },
+  "&omega;": { "codepoints": [969], "characters": "\u03C9" },
+  "&Omicron;": { "codepoints": [927], "characters": "\u039F" },
+  "&omicron;": { "codepoints": [959], "characters": "\u03BF" },
+  "&omid;": { "codepoints": [10678], "characters": "\u29B6" },
+  "&ominus;": { "codepoints": [8854], "characters": "\u2296" },
+  "&Oopf;": { "codepoints": [120134], "characters": "\uD835\uDD46" },
+  "&oopf;": { "codepoints": [120160], "characters": "\uD835\uDD60" },
+  "&opar;": { "codepoints": [10679], "characters": "\u29B7" },
+  "&OpenCurlyDoubleQuote;": { "codepoints": [8220], "characters": "\u201C" },
+  "&OpenCurlyQuote;": { "codepoints": [8216], "characters": "\u2018" },
+  "&operp;": { "codepoints": [10681], "characters": "\u29B9" },
+  "&oplus;": { "codepoints": [8853], "characters": "\u2295" },
+  "&orarr;": { "codepoints": [8635], "characters": "\u21BB" },
+  "&Or;": { "codepoints": [10836], "characters": "\u2A54" },
+  "&or;": { "codepoints": [8744], "characters": "\u2228" },
+  "&ord;": { "codepoints": [10845], "characters": "\u2A5D" },
+  "&order;": { "codepoints": [8500], "characters": "\u2134" },
+  "&orderof;": { "codepoints": [8500], "characters": "\u2134" },
+  "&ordf;": { "codepoints": [170], "characters": "\u00AA" },
+  "&ordf": { "codepoints": [170], "characters": "\u00AA" },
+  "&ordm;": { "codepoints": [186], "characters": "\u00BA" },
+  "&ordm": { "codepoints": [186], "characters": "\u00BA" },
+  "&origof;": { "codepoints": [8886], "characters": "\u22B6" },
+  "&oror;": { "codepoints": [10838], "characters": "\u2A56" },
+  "&orslope;": { "codepoints": [10839], "characters": "\u2A57" },
+  "&orv;": { "codepoints": [10843], "characters": "\u2A5B" },
+  "&oS;": { "codepoints": [9416], "characters": "\u24C8" },
+  "&Oscr;": { "codepoints": [119978], "characters": "\uD835\uDCAA" },
+  "&oscr;": { "codepoints": [8500], "characters": "\u2134" },
+  "&Oslash;": { "codepoints": [216], "characters": "\u00D8" },
+  "&Oslash": { "codepoints": [216], "characters": "\u00D8" },
+  "&oslash;": { "codepoints": [248], "characters": "\u00F8" },
+  "&oslash": { "codepoints": [248], "characters": "\u00F8" },
+  "&osol;": { "codepoints": [8856], "characters": "\u2298" },
+  "&Otilde;": { "codepoints": [213], "characters": "\u00D5" },
+  "&Otilde": { "codepoints": [213], "characters": "\u00D5" },
+  "&otilde;": { "codepoints": [245], "characters": "\u00F5" },
+  "&otilde": { "codepoints": [245], "characters": "\u00F5" },
+  "&otimesas;": { "codepoints": [10806], "characters": "\u2A36" },
+  "&Otimes;": { "codepoints": [10807], "characters": "\u2A37" },
+  "&otimes;": { "codepoints": [8855], "characters": "\u2297" },
+  "&Ouml;": { "codepoints": [214], "characters": "\u00D6" },
+  "&Ouml": { "codepoints": [214], "characters": "\u00D6" },
+  "&ouml;": { "codepoints": [246], "characters": "\u00F6" },
+  "&ouml": { "codepoints": [246], "characters": "\u00F6" },
+  "&ovbar;": { "codepoints": [9021], "characters": "\u233D" },
+  "&OverBar;": { "codepoints": [8254], "characters": "\u203E" },
+  "&OverBrace;": { "codepoints": [9182], "characters": "\u23DE" },
+  "&OverBracket;": { "codepoints": [9140], "characters": "\u23B4" },
+  "&OverParenthesis;": { "codepoints": [9180], "characters": "\u23DC" },
+  "&para;": { "codepoints": [182], "characters": "\u00B6" },
+  "&para": { "codepoints": [182], "characters": "\u00B6" },
+  "&parallel;": { "codepoints": [8741], "characters": "\u2225" },
+  "&par;": { "codepoints": [8741], "characters": "\u2225" },
+  "&parsim;": { "codepoints": [10995], "characters": "\u2AF3" },
+  "&parsl;": { "codepoints": [11005], "characters": "\u2AFD" },
+  "&part;": { "codepoints": [8706], "characters": "\u2202" },
+  "&PartialD;": { "codepoints": [8706], "characters": "\u2202" },
+  "&Pcy;": { "codepoints": [1055], "characters": "\u041F" },
+  "&pcy;": { "codepoints": [1087], "characters": "\u043F" },
+  "&percnt;": { "codepoints": [37], "characters": "\u0025" },
+  "&period;": { "codepoints": [46], "characters": "\u002E" },
+  "&permil;": { "codepoints": [8240], "characters": "\u2030" },
+  "&perp;": { "codepoints": [8869], "characters": "\u22A5" },
+  "&pertenk;": { "codepoints": [8241], "characters": "\u2031" },
+  "&Pfr;": { "codepoints": [120083], "characters": "\uD835\uDD13" },
+  "&pfr;": { "codepoints": [120109], "characters": "\uD835\uDD2D" },
+  "&Phi;": { "codepoints": [934], "characters": "\u03A6" },
+  "&phi;": { "codepoints": [966], "characters": "\u03C6" },
+  "&phiv;": { "codepoints": [981], "characters": "\u03D5" },
+  "&phmmat;": { "codepoints": [8499], "characters": "\u2133" },
+  "&phone;": { "codepoints": [9742], "characters": "\u260E" },
+  "&Pi;": { "codepoints": [928], "characters": "\u03A0" },
+  "&pi;": { "codepoints": [960], "characters": "\u03C0" },
+  "&pitchfork;": { "codepoints": [8916], "characters": "\u22D4" },
+  "&piv;": { "codepoints": [982], "characters": "\u03D6" },
+  "&planck;": { "codepoints": [8463], "characters": "\u210F" },
+  "&planckh;": { "codepoints": [8462], "characters": "\u210E" },
+  "&plankv;": { "codepoints": [8463], "characters": "\u210F" },
+  "&plusacir;": { "codepoints": [10787], "characters": "\u2A23" },
+  "&plusb;": { "codepoints": [8862], "characters": "\u229E" },
+  "&pluscir;": { "codepoints": [10786], "characters": "\u2A22" },
+  "&plus;": { "codepoints": [43], "characters": "\u002B" },
+  "&plusdo;": { "codepoints": [8724], "characters": "\u2214" },
+  "&plusdu;": { "codepoints": [10789], "characters": "\u2A25" },
+  "&pluse;": { "codepoints": [10866], "characters": "\u2A72" },
+  "&PlusMinus;": { "codepoints": [177], "characters": "\u00B1" },
+  "&plusmn;": { "codepoints": [177], "characters": "\u00B1" },
+  "&plusmn": { "codepoints": [177], "characters": "\u00B1" },
+  "&plussim;": { "codepoints": [10790], "characters": "\u2A26" },
+  "&plustwo;": { "codepoints": [10791], "characters": "\u2A27" },
+  "&pm;": { "codepoints": [177], "characters": "\u00B1" },
+  "&Poincareplane;": { "codepoints": [8460], "characters": "\u210C" },
+  "&pointint;": { "codepoints": [10773], "characters": "\u2A15" },
+  "&popf;": { "codepoints": [120161], "characters": "\uD835\uDD61" },
+  "&Popf;": { "codepoints": [8473], "characters": "\u2119" },
+  "&pound;": { "codepoints": [163], "characters": "\u00A3" },
+  "&pound": { "codepoints": [163], "characters": "\u00A3" },
+  "&prap;": { "codepoints": [10935], "characters": "\u2AB7" },
+  "&Pr;": { "codepoints": [10939], "characters": "\u2ABB" },
+  "&pr;": { "codepoints": [8826], "characters": "\u227A" },
+  "&prcue;": { "codepoints": [8828], "characters": "\u227C" },
+  "&precapprox;": { "codepoints": [10935], "characters": "\u2AB7" },
+  "&prec;": { "codepoints": [8826], "characters": "\u227A" },
+  "&preccurlyeq;": { "codepoints": [8828], "characters": "\u227C" },
+  "&Precedes;": { "codepoints": [8826], "characters": "\u227A" },
+  "&PrecedesEqual;": { "codepoints": [10927], "characters": "\u2AAF" },
+  "&PrecedesSlantEqual;": { "codepoints": [8828], "characters": "\u227C" },
+  "&PrecedesTilde;": { "codepoints": [8830], "characters": "\u227E" },
+  "&preceq;": { "codepoints": [10927], "characters": "\u2AAF" },
+  "&precnapprox;": { "codepoints": [10937], "characters": "\u2AB9" },
+  "&precneqq;": { "codepoints": [10933], "characters": "\u2AB5" },
+  "&precnsim;": { "codepoints": [8936], "characters": "\u22E8" },
+  "&pre;": { "codepoints": [10927], "characters": "\u2AAF" },
+  "&prE;": { "codepoints": [10931], "characters": "\u2AB3" },
+  "&precsim;": { "codepoints": [8830], "characters": "\u227E" },
+  "&prime;": { "codepoints": [8242], "characters": "\u2032" },
+  "&Prime;": { "codepoints": [8243], "characters": "\u2033" },
+  "&primes;": { "codepoints": [8473], "characters": "\u2119" },
+  "&prnap;": { "codepoints": [10937], "characters": "\u2AB9" },
+  "&prnE;": { "codepoints": [10933], "characters": "\u2AB5" },
+  "&prnsim;": { "codepoints": [8936], "characters": "\u22E8" },
+  "&prod;": { "codepoints": [8719], "characters": "\u220F" },
+  "&Product;": { "codepoints": [8719], "characters": "\u220F" },
+  "&profalar;": { "codepoints": [9006], "characters": "\u232E" },
+  "&profline;": { "codepoints": [8978], "characters": "\u2312" },
+  "&profsurf;": { "codepoints": [8979], "characters": "\u2313" },
+  "&prop;": { "codepoints": [8733], "characters": "\u221D" },
+  "&Proportional;": { "codepoints": [8733], "characters": "\u221D" },
+  "&Proportion;": { "codepoints": [8759], "characters": "\u2237" },
+  "&propto;": { "codepoints": [8733], "characters": "\u221D" },
+  "&prsim;": { "codepoints": [8830], "characters": "\u227E" },
+  "&prurel;": { "codepoints": [8880], "characters": "\u22B0" },
+  "&Pscr;": { "codepoints": [119979], "characters": "\uD835\uDCAB" },
+  "&pscr;": { "codepoints": [120005], "characters": "\uD835\uDCC5" },
+  "&Psi;": { "codepoints": [936], "characters": "\u03A8" },
+  "&psi;": { "codepoints": [968], "characters": "\u03C8" },
+  "&puncsp;": { "codepoints": [8200], "characters": "\u2008" },
+  "&Qfr;": { "codepoints": [120084], "characters": "\uD835\uDD14" },
+  "&qfr;": { "codepoints": [120110], "characters": "\uD835\uDD2E" },
+  "&qint;": { "codepoints": [10764], "characters": "\u2A0C" },
+  "&qopf;": { "codepoints": [120162], "characters": "\uD835\uDD62" },
+  "&Qopf;": { "codepoints": [8474], "characters": "\u211A" },
+  "&qprime;": { "codepoints": [8279], "characters": "\u2057" },
+  "&Qscr;": { "codepoints": [119980], "characters": "\uD835\uDCAC" },
+  "&qscr;": { "codepoints": [120006], "characters": "\uD835\uDCC6" },
+  "&quaternions;": { "codepoints": [8461], "characters": "\u210D" },
+  "&quatint;": { "codepoints": [10774], "characters": "\u2A16" },
+  "&quest;": { "codepoints": [63], "characters": "\u003F" },
+  "&questeq;": { "codepoints": [8799], "characters": "\u225F" },
+  "&quot;": { "codepoints": [34], "characters": "\u0022" },
+  "&quot": { "codepoints": [34], "characters": "\u0022" },
+  "&QUOT;": { "codepoints": [34], "characters": "\u0022" },
+  "&QUOT": { "codepoints": [34], "characters": "\u0022" },
+  "&rAarr;": { "codepoints": [8667], "characters": "\u21DB" },
+  "&race;": { "codepoints": [8765, 817], "characters": "\u223D\u0331" },
+  "&Racute;": { "codepoints": [340], "characters": "\u0154" },
+  "&racute;": { "codepoints": [341], "characters": "\u0155" },
+  "&radic;": { "codepoints": [8730], "characters": "\u221A" },
+  "&raemptyv;": { "codepoints": [10675], "characters": "\u29B3" },
+  "&rang;": { "codepoints": [10217], "characters": "\u27E9" },
+  "&Rang;": { "codepoints": [10219], "characters": "\u27EB" },
+  "&rangd;": { "codepoints": [10642], "characters": "\u2992" },
+  "&range;": { "codepoints": [10661], "characters": "\u29A5" },
+  "&rangle;": { "codepoints": [10217], "characters": "\u27E9" },
+  "&raquo;": { "codepoints": [187], "characters": "\u00BB" },
+  "&raquo": { "codepoints": [187], "characters": "\u00BB" },
+  "&rarrap;": { "codepoints": [10613], "characters": "\u2975" },
+  "&rarrb;": { "codepoints": [8677], "characters": "\u21E5" },
+  "&rarrbfs;": { "codepoints": [10528], "characters": "\u2920" },
+  "&rarrc;": { "codepoints": [10547], "characters": "\u2933" },
+  "&rarr;": { "codepoints": [8594], "characters": "\u2192" },
+  "&Rarr;": { "codepoints": [8608], "characters": "\u21A0" },
+  "&rArr;": { "codepoints": [8658], "characters": "\u21D2" },
+  "&rarrfs;": { "codepoints": [10526], "characters": "\u291E" },
+  "&rarrhk;": { "codepoints": [8618], "characters": "\u21AA" },
+  "&rarrlp;": { "codepoints": [8620], "characters": "\u21AC" },
+  "&rarrpl;": { "codepoints": [10565], "characters": "\u2945" },
+  "&rarrsim;": { "codepoints": [10612], "characters": "\u2974" },
+  "&Rarrtl;": { "codepoints": [10518], "characters": "\u2916" },
+  "&rarrtl;": { "codepoints": [8611], "characters": "\u21A3" },
+  "&rarrw;": { "codepoints": [8605], "characters": "\u219D" },
+  "&ratail;": { "codepoints": [10522], "characters": "\u291A" },
+  "&rAtail;": { "codepoints": [10524], "characters": "\u291C" },
+  "&ratio;": { "codepoints": [8758], "characters": "\u2236" },
+  "&rationals;": { "codepoints": [8474], "characters": "\u211A" },
+  "&rbarr;": { "codepoints": [10509], "characters": "\u290D" },
+  "&rBarr;": { "codepoints": [10511], "characters": "\u290F" },
+  "&RBarr;": { "codepoints": [10512], "characters": "\u2910" },
+  "&rbbrk;": { "codepoints": [10099], "characters": "\u2773" },
+  "&rbrace;": { "codepoints": [125], "characters": "\u007D" },
+  "&rbrack;": { "codepoints": [93], "characters": "\u005D" },
+  "&rbrke;": { "codepoints": [10636], "characters": "\u298C" },
+  "&rbrksld;": { "codepoints": [10638], "characters": "\u298E" },
+  "&rbrkslu;": { "codepoints": [10640], "characters": "\u2990" },
+  "&Rcaron;": { "codepoints": [344], "characters": "\u0158" },
+  "&rcaron;": { "codepoints": [345], "characters": "\u0159" },
+  "&Rcedil;": { "codepoints": [342], "characters": "\u0156" },
+  "&rcedil;": { "codepoints": [343], "characters": "\u0157" },
+  "&rceil;": { "codepoints": [8969], "characters": "\u2309" },
+  "&rcub;": { "codepoints": [125], "characters": "\u007D" },
+  "&Rcy;": { "codepoints": [1056], "characters": "\u0420" },
+  "&rcy;": { "codepoints": [1088], "characters": "\u0440" },
+  "&rdca;": { "codepoints": [10551], "characters": "\u2937" },
+  "&rdldhar;": { "codepoints": [10601], "characters": "\u2969" },
+  "&rdquo;": { "codepoints": [8221], "characters": "\u201D" },
+  "&rdquor;": { "codepoints": [8221], "characters": "\u201D" },
+  "&rdsh;": { "codepoints": [8627], "characters": "\u21B3" },
+  "&real;": { "codepoints": [8476], "characters": "\u211C" },
+  "&realine;": { "codepoints": [8475], "characters": "\u211B" },
+  "&realpart;": { "codepoints": [8476], "characters": "\u211C" },
+  "&reals;": { "codepoints": [8477], "characters": "\u211D" },
+  "&Re;": { "codepoints": [8476], "characters": "\u211C" },
+  "&rect;": { "codepoints": [9645], "characters": "\u25AD" },
+  "&reg;": { "codepoints": [174], "characters": "\u00AE" },
+  "&reg": { "codepoints": [174], "characters": "\u00AE" },
+  "&REG;": { "codepoints": [174], "characters": "\u00AE" },
+  "&REG": { "codepoints": [174], "characters": "\u00AE" },
+  "&ReverseElement;": { "codepoints": [8715], "characters": "\u220B" },
+  "&ReverseEquilibrium;": { "codepoints": [8651], "characters": "\u21CB" },
+  "&ReverseUpEquilibrium;": { "codepoints": [10607], "characters": "\u296F" },
+  "&rfisht;": { "codepoints": [10621], "characters": "\u297D" },
+  "&rfloor;": { "codepoints": [8971], "characters": "\u230B" },
+  "&rfr;": { "codepoints": [120111], "characters": "\uD835\uDD2F" },
+  "&Rfr;": { "codepoints": [8476], "characters": "\u211C" },
+  "&rHar;": { "codepoints": [10596], "characters": "\u2964" },
+  "&rhard;": { "codepoints": [8641], "characters": "\u21C1" },
+  "&rharu;": { "codepoints": [8640], "characters": "\u21C0" },
+  "&rharul;": { "codepoints": [10604], "characters": "\u296C" },
+  "&Rho;": { "codepoints": [929], "characters": "\u03A1" },
+  "&rho;": { "codepoints": [961], "characters": "\u03C1" },
+  "&rhov;": { "codepoints": [1009], "characters": "\u03F1" },
+  "&RightAngleBracket;": { "codepoints": [10217], "characters": "\u27E9" },
+  "&RightArrowBar;": { "codepoints": [8677], "characters": "\u21E5" },
+  "&rightarrow;": { "codepoints": [8594], "characters": "\u2192" },
+  "&RightArrow;": { "codepoints": [8594], "characters": "\u2192" },
+  "&Rightarrow;": { "codepoints": [8658], "characters": "\u21D2" },
+  "&RightArrowLeftArrow;": { "codepoints": [8644], "characters": "\u21C4" },
+  "&rightarrowtail;": { "codepoints": [8611], "characters": "\u21A3" },
+  "&RightCeiling;": { "codepoints": [8969], "characters": "\u2309" },
+  "&RightDoubleBracket;": { "codepoints": [10215], "characters": "\u27E7" },
+  "&RightDownTeeVector;": { "codepoints": [10589], "characters": "\u295D" },
+  "&RightDownVectorBar;": { "codepoints": [10581], "characters": "\u2955" },
+  "&RightDownVector;": { "codepoints": [8642], "characters": "\u21C2" },
+  "&RightFloor;": { "codepoints": [8971], "characters": "\u230B" },
+  "&rightharpoondown;": { "codepoints": [8641], "characters": "\u21C1" },
+  "&rightharpoonup;": { "codepoints": [8640], "characters": "\u21C0" },
+  "&rightleftarrows;": { "codepoints": [8644], "characters": "\u21C4" },
+  "&rightleftharpoons;": { "codepoints": [8652], "characters": "\u21CC" },
+  "&rightrightarrows;": { "codepoints": [8649], "characters": "\u21C9" },
+  "&rightsquigarrow;": { "codepoints": [8605], "characters": "\u219D" },
+  "&RightTeeArrow;": { "codepoints": [8614], "characters": "\u21A6" },
+  "&RightTee;": { "codepoints": [8866], "characters": "\u22A2" },
+  "&RightTeeVector;": { "codepoints": [10587], "characters": "\u295B" },
+  "&rightthreetimes;": { "codepoints": [8908], "characters": "\u22CC" },
+  "&RightTriangleBar;": { "codepoints": [10704], "characters": "\u29D0" },
+  "&RightTriangle;": { "codepoints": [8883], "characters": "\u22B3" },
+  "&RightTriangleEqual;": { "codepoints": [8885], "characters": "\u22B5" },
+  "&RightUpDownVector;": { "codepoints": [10575], "characters": "\u294F" },
+  "&RightUpTeeVector;": { "codepoints": [10588], "characters": "\u295C" },
+  "&RightUpVectorBar;": { "codepoints": [10580], "characters": "\u2954" },
+  "&RightUpVector;": { "codepoints": [8638], "characters": "\u21BE" },
+  "&RightVectorBar;": { "codepoints": [10579], "characters": "\u2953" },
+  "&RightVector;": { "codepoints": [8640], "characters": "\u21C0" },
+  "&ring;": { "codepoints": [730], "characters": "\u02DA" },
+  "&risingdotseq;": { "codepoints": [8787], "characters": "\u2253" },
+  "&rlarr;": { "codepoints": [8644], "characters": "\u21C4" },
+  "&rlhar;": { "codepoints": [8652], "characters": "\u21CC" },
+  "&rlm;": { "codepoints": [8207], "characters": "\u200F" },
+  "&rmoustache;": { "codepoints": [9137], "characters": "\u23B1" },
+  "&rmoust;": { "codepoints": [9137], "characters": "\u23B1" },
+  "&rnmid;": { "codepoints": [10990], "characters": "\u2AEE" },
+  "&roang;": { "codepoints": [10221], "characters": "\u27ED" },
+  "&roarr;": { "codepoints": [8702], "characters": "\u21FE" },
+  "&robrk;": { "codepoints": [10215], "characters": "\u27E7" },
+  "&ropar;": { "codepoints": [10630], "characters": "\u2986" },
+  "&ropf;": { "codepoints": [120163], "characters": "\uD835\uDD63" },
+  "&Ropf;": { "codepoints": [8477], "characters": "\u211D" },
+  "&roplus;": { "codepoints": [10798], "characters": "\u2A2E" },
+  "&rotimes;": { "codepoints": [10805], "characters": "\u2A35" },
+  "&RoundImplies;": { "codepoints": [10608], "characters": "\u2970" },
+  "&rpar;": { "codepoints": [41], "characters": "\u0029" },
+  "&rpargt;": { "codepoints": [10644], "characters": "\u2994" },
+  "&rppolint;": { "codepoints": [10770], "characters": "\u2A12" },
+  "&rrarr;": { "codepoints": [8649], "characters": "\u21C9" },
+  "&Rrightarrow;": { "codepoints": [8667], "characters": "\u21DB" },
+  "&rsaquo;": { "codepoints": [8250], "characters": "\u203A" },
+  "&rscr;": { "codepoints": [120007], "characters": "\uD835\uDCC7" },
+  "&Rscr;": { "codepoints": [8475], "characters": "\u211B" },
+  "&rsh;": { "codepoints": [8625], "characters": "\u21B1" },
+  "&Rsh;": { "codepoints": [8625], "characters": "\u21B1" },
+  "&rsqb;": { "codepoints": [93], "characters": "\u005D" },
+  "&rsquo;": { "codepoints": [8217], "characters": "\u2019" },
+  "&rsquor;": { "codepoints": [8217], "characters": "\u2019" },
+  "&rthree;": { "codepoints": [8908], "characters": "\u22CC" },
+  "&rtimes;": { "codepoints": [8906], "characters": "\u22CA" },
+  "&rtri;": { "codepoints": [9657], "characters": "\u25B9" },
+  "&rtrie;": { "codepoints": [8885], "characters": "\u22B5" },
+  "&rtrif;": { "codepoints": [9656], "characters": "\u25B8" },
+  "&rtriltri;": { "codepoints": [10702], "characters": "\u29CE" },
+  "&RuleDelayed;": { "codepoints": [10740], "characters": "\u29F4" },
+  "&ruluhar;": { "codepoints": [10600], "characters": "\u2968" },
+  "&rx;": { "codepoints": [8478], "characters": "\u211E" },
+  "&Sacute;": { "codepoints": [346], "characters": "\u015A" },
+  "&sacute;": { "codepoints": [347], "characters": "\u015B" },
+  "&sbquo;": { "codepoints": [8218], "characters": "\u201A" },
+  "&scap;": { "codepoints": [10936], "characters": "\u2AB8" },
+  "&Scaron;": { "codepoints": [352], "characters": "\u0160" },
+  "&scaron;": { "codepoints": [353], "characters": "\u0161" },
+  "&Sc;": { "codepoints": [10940], "characters": "\u2ABC" },
+  "&sc;": { "codepoints": [8827], "characters": "\u227B" },
+  "&sccue;": { "codepoints": [8829], "characters": "\u227D" },
+  "&sce;": { "codepoints": [10928], "characters": "\u2AB0" },
+  "&scE;": { "codepoints": [10932], "characters": "\u2AB4" },
+  "&Scedil;": { "codepoints": [350], "characters": "\u015E" },
+  "&scedil;": { "codepoints": [351], "characters": "\u015F" },
+  "&Scirc;": { "codepoints": [348], "characters": "\u015C" },
+  "&scirc;": { "codepoints": [349], "characters": "\u015D" },
+  "&scnap;": { "codepoints": [10938], "characters": "\u2ABA" },
+  "&scnE;": { "codepoints": [10934], "characters": "\u2AB6" },
+  "&scnsim;": { "codepoints": [8937], "characters": "\u22E9" },
+  "&scpolint;": { "codepoints": [10771], "characters": "\u2A13" },
+  "&scsim;": { "codepoints": [8831], "characters": "\u227F" },
+  "&Scy;": { "codepoints": [1057], "characters": "\u0421" },
+  "&scy;": { "codepoints": [1089], "characters": "\u0441" },
+  "&sdotb;": { "codepoints": [8865], "characters": "\u22A1" },
+  "&sdot;": { "codepoints": [8901], "characters": "\u22C5" },
+  "&sdote;": { "codepoints": [10854], "characters": "\u2A66" },
+  "&searhk;": { "codepoints": [10533], "characters": "\u2925" },
+  "&searr;": { "codepoints": [8600], "characters": "\u2198" },
+  "&seArr;": { "codepoints": [8664], "characters": "\u21D8" },
+  "&searrow;": { "codepoints": [8600], "characters": "\u2198" },
+  "&sect;": { "codepoints": [167], "characters": "\u00A7" },
+  "&sect": { "codepoints": [167], "characters": "\u00A7" },
+  "&semi;": { "codepoints": [59], "characters": "\u003B" },
+  "&seswar;": { "codepoints": [10537], "characters": "\u2929" },
+  "&setminus;": { "codepoints": [8726], "characters": "\u2216" },
+  "&setmn;": { "codepoints": [8726], "characters": "\u2216" },
+  "&sext;": { "codepoints": [10038], "characters": "\u2736" },
+  "&Sfr;": { "codepoints": [120086], "characters": "\uD835\uDD16" },
+  "&sfr;": { "codepoints": [120112], "characters": "\uD835\uDD30" },
+  "&sfrown;": { "codepoints": [8994], "characters": "\u2322" },
+  "&sharp;": { "codepoints": [9839], "characters": "\u266F" },
+  "&SHCHcy;": { "codepoints": [1065], "characters": "\u0429" },
+  "&shchcy;": { "codepoints": [1097], "characters": "\u0449" },
+  "&SHcy;": { "codepoints": [1064], "characters": "\u0428" },
+  "&shcy;": { "codepoints": [1096], "characters": "\u0448" },
+  "&ShortDownArrow;": { "codepoints": [8595], "characters": "\u2193" },
+  "&ShortLeftArrow;": { "codepoints": [8592], "characters": "\u2190" },
+  "&shortmid;": { "codepoints": [8739], "characters": "\u2223" },
+  "&shortparallel;": { "codepoints": [8741], "characters": "\u2225" },
+  "&ShortRightArrow;": { "codepoints": [8594], "characters": "\u2192" },
+  "&ShortUpArrow;": { "codepoints": [8593], "characters": "\u2191" },
+  "&shy;": { "codepoints": [173], "characters": "\u00AD" },
+  "&shy": { "codepoints": [173], "characters": "\u00AD" },
+  "&Sigma;": { "codepoints": [931], "characters": "\u03A3" },
+  "&sigma;": { "codepoints": [963], "characters": "\u03C3" },
+  "&sigmaf;": { "codepoints": [962], "characters": "\u03C2" },
+  "&sigmav;": { "codepoints": [962], "characters": "\u03C2" },
+  "&sim;": { "codepoints": [8764], "characters": "\u223C" },
+  "&simdot;": { "codepoints": [10858], "characters": "\u2A6A" },
+  "&sime;": { "codepoints": [8771], "characters": "\u2243" },
+  "&simeq;": { "codepoints": [8771], "characters": "\u2243" },
+  "&simg;": { "codepoints": [10910], "characters": "\u2A9E" },
+  "&simgE;": { "codepoints": [10912], "characters": "\u2AA0" },
+  "&siml;": { "codepoints": [10909], "characters": "\u2A9D" },
+  "&simlE;": { "codepoints": [10911], "characters": "\u2A9F" },
+  "&simne;": { "codepoints": [8774], "characters": "\u2246" },
+  "&simplus;": { "codepoints": [10788], "characters": "\u2A24" },
+  "&simrarr;": { "codepoints": [10610], "characters": "\u2972" },
+  "&slarr;": { "codepoints": [8592], "characters": "\u2190" },
+  "&SmallCircle;": { "codepoints": [8728], "characters": "\u2218" },
+  "&smallsetminus;": { "codepoints": [8726], "characters": "\u2216" },
+  "&smashp;": { "codepoints": [10803], "characters": "\u2A33" },
+  "&smeparsl;": { "codepoints": [10724], "characters": "\u29E4" },
+  "&smid;": { "codepoints": [8739], "characters": "\u2223" },
+  "&smile;": { "codepoints": [8995], "characters": "\u2323" },
+  "&smt;": { "codepoints": [10922], "characters": "\u2AAA" },
+  "&smte;": { "codepoints": [10924], "characters": "\u2AAC" },
+  "&smtes;": { "codepoints": [10924, 65024], "characters": "\u2AAC\uFE00" },
+  "&SOFTcy;": { "codepoints": [1068], "characters": "\u042C" },
+  "&softcy;": { "codepoints": [1100], "characters": "\u044C" },
+  "&solbar;": { "codepoints": [9023], "characters": "\u233F" },
+  "&solb;": { "codepoints": [10692], "characters": "\u29C4" },
+  "&sol;": { "codepoints": [47], "characters": "\u002F" },
+  "&Sopf;": { "codepoints": [120138], "characters": "\uD835\uDD4A" },
+  "&sopf;": { "codepoints": [120164], "characters": "\uD835\uDD64" },
+  "&spades;": { "codepoints": [9824], "characters": "\u2660" },
+  "&spadesuit;": { "codepoints": [9824], "characters": "\u2660" },
+  "&spar;": { "codepoints": [8741], "characters": "\u2225" },
+  "&sqcap;": { "codepoints": [8851], "characters": "\u2293" },
+  "&sqcaps;": { "codepoints": [8851, 65024], "characters": "\u2293\uFE00" },
+  "&sqcup;": { "codepoints": [8852], "characters": "\u2294" },
+  "&sqcups;": { "codepoints": [8852, 65024], "characters": "\u2294\uFE00" },
+  "&Sqrt;": { "codepoints": [8730], "characters": "\u221A" },
+  "&sqsub;": { "codepoints": [8847], "characters": "\u228F" },
+  "&sqsube;": { "codepoints": [8849], "characters": "\u2291" },
+  "&sqsubset;": { "codepoints": [8847], "characters": "\u228F" },
+  "&sqsubseteq;": { "codepoints": [8849], "characters": "\u2291" },
+  "&sqsup;": { "codepoints": [8848], "characters": "\u2290" },
+  "&sqsupe;": { "codepoints": [8850], "characters": "\u2292" },
+  "&sqsupset;": { "codepoints": [8848], "characters": "\u2290" },
+  "&sqsupseteq;": { "codepoints": [8850], "characters": "\u2292" },
+  "&square;": { "codepoints": [9633], "characters": "\u25A1" },
+  "&Square;": { "codepoints": [9633], "characters": "\u25A1" },
+  "&SquareIntersection;": { "codepoints": [8851], "characters": "\u2293" },
+  "&SquareSubset;": { "codepoints": [8847], "characters": "\u228F" },
+  "&SquareSubsetEqual;": { "codepoints": [8849], "characters": "\u2291" },
+  "&SquareSuperset;": { "codepoints": [8848], "characters": "\u2290" },
+  "&SquareSupersetEqual;": { "codepoints": [8850], "characters": "\u2292" },
+  "&SquareUnion;": { "codepoints": [8852], "characters": "\u2294" },
+  "&squarf;": { "codepoints": [9642], "characters": "\u25AA" },
+  "&squ;": { "codepoints": [9633], "characters": "\u25A1" },
+  "&squf;": { "codepoints": [9642], "characters": "\u25AA" },
+  "&srarr;": { "codepoints": [8594], "characters": "\u2192" },
+  "&Sscr;": { "codepoints": [119982], "characters": "\uD835\uDCAE" },
+  "&sscr;": { "codepoints": [120008], "characters": "\uD835\uDCC8" },
+  "&ssetmn;": { "codepoints": [8726], "characters": "\u2216" },
+  "&ssmile;": { "codepoints": [8995], "characters": "\u2323" },
+  "&sstarf;": { "codepoints": [8902], "characters": "\u22C6" },
+  "&Star;": { "codepoints": [8902], "characters": "\u22C6" },
+  "&star;": { "codepoints": [9734], "characters": "\u2606" },
+  "&starf;": { "codepoints": [9733], "characters": "\u2605" },
+  "&straightepsilon;": { "codepoints": [1013], "characters": "\u03F5" },
+  "&straightphi;": { "codepoints": [981], "characters": "\u03D5" },
+  "&strns;": { "codepoints": [175], "characters": "\u00AF" },
+  "&sub;": { "codepoints": [8834], "characters": "\u2282" },
+  "&Sub;": { "codepoints": [8912], "characters": "\u22D0" },
+  "&subdot;": { "codepoints": [10941], "characters": "\u2ABD" },
+  "&subE;": { "codepoints": [10949], "characters": "\u2AC5" },
+  "&sube;": { "codepoints": [8838], "characters": "\u2286" },
+  "&subedot;": { "codepoints": [10947], "characters": "\u2AC3" },
+  "&submult;": { "codepoints": [10945], "characters": "\u2AC1" },
+  "&subnE;": { "codepoints": [10955], "characters": "\u2ACB" },
+  "&subne;": { "codepoints": [8842], "characters": "\u228A" },
+  "&subplus;": { "codepoints": [10943], "characters": "\u2ABF" },
+  "&subrarr;": { "codepoints": [10617], "characters": "\u2979" },
+  "&subset;": { "codepoints": [8834], "characters": "\u2282" },
+  "&Subset;": { "codepoints": [8912], "characters": "\u22D0" },
+  "&subseteq;": { "codepoints": [8838], "characters": "\u2286" },
+  "&subseteqq;": { "codepoints": [10949], "characters": "\u2AC5" },
+  "&SubsetEqual;": { "codepoints": [8838], "characters": "\u2286" },
+  "&subsetneq;": { "codepoints": [8842], "characters": "\u228A" },
+  "&subsetneqq;": { "codepoints": [10955], "characters": "\u2ACB" },
+  "&subsim;": { "codepoints": [10951], "characters": "\u2AC7" },
+  "&subsub;": { "codepoints": [10965], "characters": "\u2AD5" },
+  "&subsup;": { "codepoints": [10963], "characters": "\u2AD3" },
+  "&succapprox;": { "codepoints": [10936], "characters": "\u2AB8" },
+  "&succ;": { "codepoints": [8827], "characters": "\u227B" },
+  "&succcurlyeq;": { "codepoints": [8829], "characters": "\u227D" },
+  "&Succeeds;": { "codepoints": [8827], "characters": "\u227B" },
+  "&SucceedsEqual;": { "codepoints": [10928], "characters": "\u2AB0" },
+  "&SucceedsSlantEqual;": { "codepoints": [8829], "characters": "\u227D" },
+  "&SucceedsTilde;": { "codepoints": [8831], "characters": "\u227F" },
+  "&succeq;": { "codepoints": [10928], "characters": "\u2AB0" },
+  "&succnapprox;": { "codepoints": [10938], "characters": "\u2ABA" },
+  "&succneqq;": { "codepoints": [10934], "characters": "\u2AB6" },
+  "&succnsim;": { "codepoints": [8937], "characters": "\u22E9" },
+  "&succsim;": { "codepoints": [8831], "characters": "\u227F" },
+  "&SuchThat;": { "codepoints": [8715], "characters": "\u220B" },
+  "&sum;": { "codepoints": [8721], "characters": "\u2211" },
+  "&Sum;": { "codepoints": [8721], "characters": "\u2211" },
+  "&sung;": { "codepoints": [9834], "characters": "\u266A" },
+  "&sup1;": { "codepoints": [185], "characters": "\u00B9" },
+  "&sup1": { "codepoints": [185], "characters": "\u00B9" },
+  "&sup2;": { "codepoints": [178], "characters": "\u00B2" },
+  "&sup2": { "codepoints": [178], "characters": "\u00B2" },
+  "&sup3;": { "codepoints": [179], "characters": "\u00B3" },
+  "&sup3": { "codepoints": [179], "characters": "\u00B3" },
+  "&sup;": { "codepoints": [8835], "characters": "\u2283" },
+  "&Sup;": { "codepoints": [8913], "characters": "\u22D1" },
+  "&supdot;": { "codepoints": [10942], "characters": "\u2ABE" },
+  "&supdsub;": { "codepoints": [10968], "characters": "\u2AD8" },
+  "&supE;": { "codepoints": [10950], "characters": "\u2AC6" },
+  "&supe;": { "codepoints": [8839], "characters": "\u2287" },
+  "&supedot;": { "codepoints": [10948], "characters": "\u2AC4" },
+  "&Superset;": { "codepoints": [8835], "characters": "\u2283" },
+  "&SupersetEqual;": { "codepoints": [8839], "characters": "\u2287" },
+  "&suphsol;": { "codepoints": [10185], "characters": "\u27C9" },
+  "&suphsub;": { "codepoints": [10967], "characters": "\u2AD7" },
+  "&suplarr;": { "codepoints": [10619], "characters": "\u297B" },
+  "&supmult;": { "codepoints": [10946], "characters": "\u2AC2" },
+  "&supnE;": { "codepoints": [10956], "characters": "\u2ACC" },
+  "&supne;": { "codepoints": [8843], "characters": "\u228B" },
+  "&supplus;": { "codepoints": [10944], "characters": "\u2AC0" },
+  "&supset;": { "codepoints": [8835], "characters": "\u2283" },
+  "&Supset;": { "codepoints": [8913], "characters": "\u22D1" },
+  "&supseteq;": { "codepoints": [8839], "characters": "\u2287" },
+  "&supseteqq;": { "codepoints": [10950], "characters": "\u2AC6" },
+  "&supsetneq;": { "codepoints": [8843], "characters": "\u228B" },
+  "&supsetneqq;": { "codepoints": [10956], "characters": "\u2ACC" },
+  "&supsim;": { "codepoints": [10952], "characters": "\u2AC8" },
+  "&supsub;": { "codepoints": [10964], "characters": "\u2AD4" },
+  "&supsup;": { "codepoints": [10966], "characters": "\u2AD6" },
+  "&swarhk;": { "codepoints": [10534], "characters": "\u2926" },
+  "&swarr;": { "codepoints": [8601], "characters": "\u2199" },
+  "&swArr;": { "codepoints": [8665], "characters": "\u21D9" },
+  "&swarrow;": { "codepoints": [8601], "characters": "\u2199" },
+  "&swnwar;": { "codepoints": [10538], "characters": "\u292A" },
+  "&szlig;": { "codepoints": [223], "characters": "\u00DF" },
+  "&szlig": { "codepoints": [223], "characters": "\u00DF" },
+  "&Tab;": { "codepoints": [9], "characters": "\u0009" },
+  "&target;": { "codepoints": [8982], "characters": "\u2316" },
+  "&Tau;": { "codepoints": [932], "characters": "\u03A4" },
+  "&tau;": { "codepoints": [964], "characters": "\u03C4" },
+  "&tbrk;": { "codepoints": [9140], "characters": "\u23B4" },
+  "&Tcaron;": { "codepoints": [356], "characters": "\u0164" },
+  "&tcaron;": { "codepoints": [357], "characters": "\u0165" },
+  "&Tcedil;": { "codepoints": [354], "characters": "\u0162" },
+  "&tcedil;": { "codepoints": [355], "characters": "\u0163" },
+  "&Tcy;": { "codepoints": [1058], "characters": "\u0422" },
+  "&tcy;": { "codepoints": [1090], "characters": "\u0442" },
+  "&tdot;": { "codepoints": [8411], "characters": "\u20DB" },
+  "&telrec;": { "codepoints": [8981], "characters": "\u2315" },
+  "&Tfr;": { "codepoints": [120087], "characters": "\uD835\uDD17" },
+  "&tfr;": { "codepoints": [120113], "characters": "\uD835\uDD31" },
+  "&there4;": { "codepoints": [8756], "characters": "\u2234" },
+  "&therefore;": { "codepoints": [8756], "characters": "\u2234" },
+  "&Therefore;": { "codepoints": [8756], "characters": "\u2234" },
+  "&Theta;": { "codepoints": [920], "characters": "\u0398" },
+  "&theta;": { "codepoints": [952], "characters": "\u03B8" },
+  "&thetasym;": { "codepoints": [977], "characters": "\u03D1" },
+  "&thetav;": { "codepoints": [977], "characters": "\u03D1" },
+  "&thickapprox;": { "codepoints": [8776], "characters": "\u2248" },
+  "&thicksim;": { "codepoints": [8764], "characters": "\u223C" },
+  "&ThickSpace;": { "codepoints": [8287, 8202], "characters": "\u205F\u200A" },
+  "&ThinSpace;": { "codepoints": [8201], "characters": "\u2009" },
+  "&thinsp;": { "codepoints": [8201], "characters": "\u2009" },
+  "&thkap;": { "codepoints": [8776], "characters": "\u2248" },
+  "&thksim;": { "codepoints": [8764], "characters": "\u223C" },
+  "&THORN;": { "codepoints": [222], "characters": "\u00DE" },
+  "&THORN": { "codepoints": [222], "characters": "\u00DE" },
+  "&thorn;": { "codepoints": [254], "characters": "\u00FE" },
+  "&thorn": { "codepoints": [254], "characters": "\u00FE" },
+  "&tilde;": { "codepoints": [732], "characters": "\u02DC" },
+  "&Tilde;": { "codepoints": [8764], "characters": "\u223C" },
+  "&TildeEqual;": { "codepoints": [8771], "characters": "\u2243" },
+  "&TildeFullEqual;": { "codepoints": [8773], "characters": "\u2245" },
+  "&TildeTilde;": { "codepoints": [8776], "characters": "\u2248" },
+  "&timesbar;": { "codepoints": [10801], "characters": "\u2A31" },
+  "&timesb;": { "codepoints": [8864], "characters": "\u22A0" },
+  "&times;": { "codepoints": [215], "characters": "\u00D7" },
+  "&times": { "codepoints": [215], "characters": "\u00D7" },
+  "&timesd;": { "codepoints": [10800], "characters": "\u2A30" },
+  "&tint;": { "codepoints": [8749], "characters": "\u222D" },
+  "&toea;": { "codepoints": [10536], "characters": "\u2928" },
+  "&topbot;": { "codepoints": [9014], "characters": "\u2336" },
+  "&topcir;": { "codepoints": [10993], "characters": "\u2AF1" },
+  "&top;": { "codepoints": [8868], "characters": "\u22A4" },
+  "&Topf;": { "codepoints": [120139], "characters": "\uD835\uDD4B" },
+  "&topf;": { "codepoints": [120165], "characters": "\uD835\uDD65" },
+  "&topfork;": { "codepoints": [10970], "characters": "\u2ADA" },
+  "&tosa;": { "codepoints": [10537], "characters": "\u2929" },
+  "&tprime;": { "codepoints": [8244], "characters": "\u2034" },
+  "&trade;": { "codepoints": [8482], "characters": "\u2122" },
+  "&TRADE;": { "codepoints": [8482], "characters": "\u2122" },
+  "&triangle;": { "codepoints": [9653], "characters": "\u25B5" },
+  "&triangledown;": { "codepoints": [9663], "characters": "\u25BF" },
+  "&triangleleft;": { "codepoints": [9667], "characters": "\u25C3" },
+  "&trianglelefteq;": { "codepoints": [8884], "characters": "\u22B4" },
+  "&triangleq;": { "codepoints": [8796], "characters": "\u225C" },
+  "&triangleright;": { "codepoints": [9657], "characters": "\u25B9" },
+  "&trianglerighteq;": { "codepoints": [8885], "characters": "\u22B5" },
+  "&tridot;": { "codepoints": [9708], "characters": "\u25EC" },
+  "&trie;": { "codepoints": [8796], "characters": "\u225C" },
+  "&triminus;": { "codepoints": [10810], "characters": "\u2A3A" },
+  "&TripleDot;": { "codepoints": [8411], "characters": "\u20DB" },
+  "&triplus;": { "codepoints": [10809], "characters": "\u2A39" },
+  "&trisb;": { "codepoints": [10701], "characters": "\u29CD" },
+  "&tritime;": { "codepoints": [10811], "characters": "\u2A3B" },
+  "&trpezium;": { "codepoints": [9186], "characters": "\u23E2" },
+  "&Tscr;": { "codepoints": [119983], "characters": "\uD835\uDCAF" },
+  "&tscr;": { "codepoints": [120009], "characters": "\uD835\uDCC9" },
+  "&TScy;": { "codepoints": [1062], "characters": "\u0426" },
+  "&tscy;": { "codepoints": [1094], "characters": "\u0446" },
+  "&TSHcy;": { "codepoints": [1035], "characters": "\u040B" },
+  "&tshcy;": { "codepoints": [1115], "characters": "\u045B" },
+  "&Tstrok;": { "codepoints": [358], "characters": "\u0166" },
+  "&tstrok;": { "codepoints": [359], "characters": "\u0167" },
+  "&twixt;": { "codepoints": [8812], "characters": "\u226C" },
+  "&twoheadleftarrow;": { "codepoints": [8606], "characters": "\u219E" },
+  "&twoheadrightarrow;": { "codepoints": [8608], "characters": "\u21A0" },
+  "&Uacute;": { "codepoints": [218], "characters": "\u00DA" },
+  "&Uacute": { "codepoints": [218], "characters": "\u00DA" },
+  "&uacute;": { "codepoints": [250], "characters": "\u00FA" },
+  "&uacute": { "codepoints": [250], "characters": "\u00FA" },
+  "&uarr;": { "codepoints": [8593], "characters": "\u2191" },
+  "&Uarr;": { "codepoints": [8607], "characters": "\u219F" },
+  "&uArr;": { "codepoints": [8657], "characters": "\u21D1" },
+  "&Uarrocir;": { "codepoints": [10569], "characters": "\u2949" },
+  "&Ubrcy;": { "codepoints": [1038], "characters": "\u040E" },
+  "&ubrcy;": { "codepoints": [1118], "characters": "\u045E" },
+  "&Ubreve;": { "codepoints": [364], "characters": "\u016C" },
+  "&ubreve;": { "codepoints": [365], "characters": "\u016D" },
+  "&Ucirc;": { "codepoints": [219], "characters": "\u00DB" },
+  "&Ucirc": { "codepoints": [219], "characters": "\u00DB" },
+  "&ucirc;": { "codepoints": [251], "characters": "\u00FB" },
+  "&ucirc": { "codepoints": [251], "characters": "\u00FB" },
+  "&Ucy;": { "codepoints": [1059], "characters": "\u0423" },
+  "&ucy;": { "codepoints": [1091], "characters": "\u0443" },
+  "&udarr;": { "codepoints": [8645], "characters": "\u21C5" },
+  "&Udblac;": { "codepoints": [368], "characters": "\u0170" },
+  "&udblac;": { "codepoints": [369], "characters": "\u0171" },
+  "&udhar;": { "codepoints": [10606], "characters": "\u296E" },
+  "&ufisht;": { "codepoints": [10622], "characters": "\u297E" },
+  "&Ufr;": { "codepoints": [120088], "characters": "\uD835\uDD18" },
+  "&ufr;": { "codepoints": [120114], "characters": "\uD835\uDD32" },
+  "&Ugrave;": { "codepoints": [217], "characters": "\u00D9" },
+  "&Ugrave": { "codepoints": [217], "characters": "\u00D9" },
+  "&ugrave;": { "codepoints": [249], "characters": "\u00F9" },
+  "&ugrave": { "codepoints": [249], "characters": "\u00F9" },
+  "&uHar;": { "codepoints": [10595], "characters": "\u2963" },
+  "&uharl;": { "codepoints": [8639], "characters": "\u21BF" },
+  "&uharr;": { "codepoints": [8638], "characters": "\u21BE" },
+  "&uhblk;": { "codepoints": [9600], "characters": "\u2580" },
+  "&ulcorn;": { "codepoints": [8988], "characters": "\u231C" },
+  "&ulcorner;": { "codepoints": [8988], "characters": "\u231C" },
+  "&ulcrop;": { "codepoints": [8975], "characters": "\u230F" },
+  "&ultri;": { "codepoints": [9720], "characters": "\u25F8" },
+  "&Umacr;": { "codepoints": [362], "characters": "\u016A" },
+  "&umacr;": { "codepoints": [363], "characters": "\u016B" },
+  "&uml;": { "codepoints": [168], "characters": "\u00A8" },
+  "&uml": { "codepoints": [168], "characters": "\u00A8" },
+  "&UnderBar;": { "codepoints": [95], "characters": "\u005F" },
+  "&UnderBrace;": { "codepoints": [9183], "characters": "\u23DF" },
+  "&UnderBracket;": { "codepoints": [9141], "characters": "\u23B5" },
+  "&UnderParenthesis;": { "codepoints": [9181], "characters": "\u23DD" },
+  "&Union;": { "codepoints": [8899], "characters": "\u22C3" },
+  "&UnionPlus;": { "codepoints": [8846], "characters": "\u228E" },
+  "&Uogon;": { "codepoints": [370], "characters": "\u0172" },
+  "&uogon;": { "codepoints": [371], "characters": "\u0173" },
+  "&Uopf;": { "codepoints": [120140], "characters": "\uD835\uDD4C" },
+  "&uopf;": { "codepoints": [120166], "characters": "\uD835\uDD66" },
+  "&UpArrowBar;": { "codepoints": [10514], "characters": "\u2912" },
+  "&uparrow;": { "codepoints": [8593], "characters": "\u2191" },
+  "&UpArrow;": { "codepoints": [8593], "characters": "\u2191" },
+  "&Uparrow;": { "codepoints": [8657], "characters": "\u21D1" },
+  "&UpArrowDownArrow;": { "codepoints": [8645], "characters": "\u21C5" },
+  "&updownarrow;": { "codepoints": [8597], "characters": "\u2195" },
+  "&UpDownArrow;": { "codepoints": [8597], "characters": "\u2195" },
+  "&Updownarrow;": { "codepoints": [8661], "characters": "\u21D5" },
+  "&UpEquilibrium;": { "codepoints": [10606], "characters": "\u296E" },
+  "&upharpoonleft;": { "codepoints": [8639], "characters": "\u21BF" },
+  "&upharpoonright;": { "codepoints": [8638], "characters": "\u21BE" },
+  "&uplus;": { "codepoints": [8846], "characters": "\u228E" },
+  "&UpperLeftArrow;": { "codepoints": [8598], "characters": "\u2196" },
+  "&UpperRightArrow;": { "codepoints": [8599], "characters": "\u2197" },
+  "&upsi;": { "codepoints": [965], "characters": "\u03C5" },
+  "&Upsi;": { "codepoints": [978], "characters": "\u03D2" },
+  "&upsih;": { "codepoints": [978], "characters": "\u03D2" },
+  "&Upsilon;": { "codepoints": [933], "characters": "\u03A5" },
+  "&upsilon;": { "codepoints": [965], "characters": "\u03C5" },
+  "&UpTeeArrow;": { "codepoints": [8613], "characters": "\u21A5" },
+  "&UpTee;": { "codepoints": [8869], "characters": "\u22A5" },
+  "&upuparrows;": { "codepoints": [8648], "characters": "\u21C8" },
+  "&urcorn;": { "codepoints": [8989], "characters": "\u231D" },
+  "&urcorner;": { "codepoints": [8989], "characters": "\u231D" },
+  "&urcrop;": { "codepoints": [8974], "characters": "\u230E" },
+  "&Uring;": { "codepoints": [366], "characters": "\u016E" },
+  "&uring;": { "codepoints": [367], "characters": "\u016F" },
+  "&urtri;": { "codepoints": [9721], "characters": "\u25F9" },
+  "&Uscr;": { "codepoints": [119984], "characters": "\uD835\uDCB0" },
+  "&uscr;": { "codepoints": [120010], "characters": "\uD835\uDCCA" },
+  "&utdot;": { "codepoints": [8944], "characters": "\u22F0" },
+  "&Utilde;": { "codepoints": [360], "characters": "\u0168" },
+  "&utilde;": { "codepoints": [361], "characters": "\u0169" },
+  "&utri;": { "codepoints": [9653], "characters": "\u25B5" },
+  "&utrif;": { "codepoints": [9652], "characters": "\u25B4" },
+  "&uuarr;": { "codepoints": [8648], "characters": "\u21C8" },
+  "&Uuml;": { "codepoints": [220], "characters": "\u00DC" },
+  "&Uuml": { "codepoints": [220], "characters": "\u00DC" },
+  "&uuml;": { "codepoints": [252], "characters": "\u00FC" },
+  "&uuml": { "codepoints": [252], "characters": "\u00FC" },
+  "&uwangle;": { "codepoints": [10663], "characters": "\u29A7" },
+  "&vangrt;": { "codepoints": [10652], "characters": "\u299C" },
+  "&varepsilon;": { "codepoints": [1013], "characters": "\u03F5" },
+  "&varkappa;": { "codepoints": [1008], "characters": "\u03F0" },
+  "&varnothing;": { "codepoints": [8709], "characters": "\u2205" },
+  "&varphi;": { "codepoints": [981], "characters": "\u03D5" },
+  "&varpi;": { "codepoints": [982], "characters": "\u03D6" },
+  "&varpropto;": { "codepoints": [8733], "characters": "\u221D" },
+  "&varr;": { "codepoints": [8597], "characters": "\u2195" },
+  "&vArr;": { "codepoints": [8661], "characters": "\u21D5" },
+  "&varrho;": { "codepoints": [1009], "characters": "\u03F1" },
+  "&varsigma;": { "codepoints": [962], "characters": "\u03C2" },
+  "&varsubsetneq;": { "codepoints": [8842, 65024], "characters": "\u228A\uFE00" },
+  "&varsubsetneqq;": { "codepoints": [10955, 65024], "characters": "\u2ACB\uFE00" },
+  "&varsupsetneq;": { "codepoints": [8843, 65024], "characters": "\u228B\uFE00" },
+  "&varsupsetneqq;": { "codepoints": [10956, 65024], "characters": "\u2ACC\uFE00" },
+  "&vartheta;": { "codepoints": [977], "characters": "\u03D1" },
+  "&vartriangleleft;": { "codepoints": [8882], "characters": "\u22B2" },
+  "&vartriangleright;": { "codepoints": [8883], "characters": "\u22B3" },
+  "&vBar;": { "codepoints": [10984], "characters": "\u2AE8" },
+  "&Vbar;": { "codepoints": [10987], "characters": "\u2AEB" },
+  "&vBarv;": { "codepoints": [10985], "characters": "\u2AE9" },
+  "&Vcy;": { "codepoints": [1042], "characters": "\u0412" },
+  "&vcy;": { "codepoints": [1074], "characters": "\u0432" },
+  "&vdash;": { "codepoints": [8866], "characters": "\u22A2" },
+  "&vDash;": { "codepoints": [8872], "characters": "\u22A8" },
+  "&Vdash;": { "codepoints": [8873], "characters": "\u22A9" },
+  "&VDash;": { "codepoints": [8875], "characters": "\u22AB" },
+  "&Vdashl;": { "codepoints": [10982], "characters": "\u2AE6" },
+  "&veebar;": { "codepoints": [8891], "characters": "\u22BB" },
+  "&vee;": { "codepoints": [8744], "characters": "\u2228" },
+  "&Vee;": { "codepoints": [8897], "characters": "\u22C1" },
+  "&veeeq;": { "codepoints": [8794], "characters": "\u225A" },
+  "&vellip;": { "codepoints": [8942], "characters": "\u22EE" },
+  "&verbar;": { "codepoints": [124], "characters": "\u007C" },
+  "&Verbar;": { "codepoints": [8214], "characters": "\u2016" },
+  "&vert;": { "codepoints": [124], "characters": "\u007C" },
+  "&Vert;": { "codepoints": [8214], "characters": "\u2016" },
+  "&VerticalBar;": { "codepoints": [8739], "characters": "\u2223" },
+  "&VerticalLine;": { "codepoints": [124], "characters": "\u007C" },
+  "&VerticalSeparator;": { "codepoints": [10072], "characters": "\u2758" },
+  "&VerticalTilde;": { "codepoints": [8768], "characters": "\u2240" },
+  "&VeryThinSpace;": { "codepoints": [8202], "characters": "\u200A" },
+  "&Vfr;": { "codepoints": [120089], "characters": "\uD835\uDD19" },
+  "&vfr;": { "codepoints": [120115], "characters": "\uD835\uDD33" },
+  "&vltri;": { "codepoints": [8882], "characters": "\u22B2" },
+  "&vnsub;": { "codepoints": [8834, 8402], "characters": "\u2282\u20D2" },
+  "&vnsup;": { "codepoints": [8835, 8402], "characters": "\u2283\u20D2" },
+  "&Vopf;": { "codepoints": [120141], "characters": "\uD835\uDD4D" },
+  "&vopf;": { "codepoints": [120167], "characters": "\uD835\uDD67" },
+  "&vprop;": { "codepoints": [8733], "characters": "\u221D" },
+  "&vrtri;": { "codepoints": [8883], "characters": "\u22B3" },
+  "&Vscr;": { "codepoints": [119985], "characters": "\uD835\uDCB1" },
+  "&vscr;": { "codepoints": [120011], "characters": "\uD835\uDCCB" },
+  "&vsubnE;": { "codepoints": [10955, 65024], "characters": "\u2ACB\uFE00" },
+  "&vsubne;": { "codepoints": [8842, 65024], "characters": "\u228A\uFE00" },
+  "&vsupnE;": { "codepoints": [10956, 65024], "characters": "\u2ACC\uFE00" },
+  "&vsupne;": { "codepoints": [8843, 65024], "characters": "\u228B\uFE00" },
+  "&Vvdash;": { "codepoints": [8874], "characters": "\u22AA" },
+  "&vzigzag;": { "codepoints": [10650], "characters": "\u299A" },
+  "&Wcirc;": { "codepoints": [372], "characters": "\u0174" },
+  "&wcirc;": { "codepoints": [373], "characters": "\u0175" },
+  "&wedbar;": { "codepoints": [10847], "characters": "\u2A5F" },
+  "&wedge;": { "codepoints": [8743], "characters": "\u2227" },
+  "&Wedge;": { "codepoints": [8896], "characters": "\u22C0" },
+  "&wedgeq;": { "codepoints": [8793], "characters": "\u2259" },
+  "&weierp;": { "codepoints": [8472], "characters": "\u2118" },
+  "&Wfr;": { "codepoints": [120090], "characters": "\uD835\uDD1A" },
+  "&wfr;": { "codepoints": [120116], "characters": "\uD835\uDD34" },
+  "&Wopf;": { "codepoints": [120142], "characters": "\uD835\uDD4E" },
+  "&wopf;": { "codepoints": [120168], "characters": "\uD835\uDD68" },
+  "&wp;": { "codepoints": [8472], "characters": "\u2118" },
+  "&wr;": { "codepoints": [8768], "characters": "\u2240" },
+  "&wreath;": { "codepoints": [8768], "characters": "\u2240" },
+  "&Wscr;": { "codepoints": [119986], "characters": "\uD835\uDCB2" },
+  "&wscr;": { "codepoints": [120012], "characters": "\uD835\uDCCC" },
+  "&xcap;": { "codepoints": [8898], "characters": "\u22C2" },
+  "&xcirc;": { "codepoints": [9711], "characters": "\u25EF" },
+  "&xcup;": { "codepoints": [8899], "characters": "\u22C3" },
+  "&xdtri;": { "codepoints": [9661], "characters": "\u25BD" },
+  "&Xfr;": { "codepoints": [120091], "characters": "\uD835\uDD1B" },
+  "&xfr;": { "codepoints": [120117], "characters": "\uD835\uDD35" },
+  "&xharr;": { "codepoints": [10231], "characters": "\u27F7" },
+  "&xhArr;": { "codepoints": [10234], "characters": "\u27FA" },
+  "&Xi;": { "codepoints": [926], "characters": "\u039E" },
+  "&xi;": { "codepoints": [958], "characters": "\u03BE" },
+  "&xlarr;": { "codepoints": [10229], "characters": "\u27F5" },
+  "&xlArr;": { "codepoints": [10232], "characters": "\u27F8" },
+  "&xmap;": { "codepoints": [10236], "characters": "\u27FC" },
+  "&xnis;": { "codepoints": [8955], "characters": "\u22FB" },
+  "&xodot;": { "codepoints": [10752], "characters": "\u2A00" },
+  "&Xopf;": { "codepoints": [120143], "characters": "\uD835\uDD4F" },
+  "&xopf;": { "codepoints": [120169], "characters": "\uD835\uDD69" },
+  "&xoplus;": { "codepoints": [10753], "characters": "\u2A01" },
+  "&xotime;": { "codepoints": [10754], "characters": "\u2A02" },
+  "&xrarr;": { "codepoints": [10230], "characters": "\u27F6" },
+  "&xrArr;": { "codepoints": [10233], "characters": "\u27F9" },
+  "&Xscr;": { "codepoints": [119987], "characters": "\uD835\uDCB3" },
+  "&xscr;": { "codepoints": [120013], "characters": "\uD835\uDCCD" },
+  "&xsqcup;": { "codepoints": [10758], "characters": "\u2A06" },
+  "&xuplus;": { "codepoints": [10756], "characters": "\u2A04" },
+  "&xutri;": { "codepoints": [9651], "characters": "\u25B3" },
+  "&xvee;": { "codepoints": [8897], "characters": "\u22C1" },
+  "&xwedge;": { "codepoints": [8896], "characters": "\u22C0" },
+  "&Yacute;": { "codepoints": [221], "characters": "\u00DD" },
+  "&Yacute": { "codepoints": [221], "characters": "\u00DD" },
+  "&yacute;": { "codepoints": [253], "characters": "\u00FD" },
+  "&yacute": { "codepoints": [253], "characters": "\u00FD" },
+  "&YAcy;": { "codepoints": [1071], "characters": "\u042F" },
+  "&yacy;": { "codepoints": [1103], "characters": "\u044F" },
+  "&Ycirc;": { "codepoints": [374], "characters": "\u0176" },
+  "&ycirc;": { "codepoints": [375], "characters": "\u0177" },
+  "&Ycy;": { "codepoints": [1067], "characters": "\u042B" },
+  "&ycy;": { "codepoints": [1099], "characters": "\u044B" },
+  "&yen;": { "codepoints": [165], "characters": "\u00A5" },
+  "&yen": { "codepoints": [165], "characters": "\u00A5" },
+  "&Yfr;": { "codepoints": [120092], "characters": "\uD835\uDD1C" },
+  "&yfr;": { "codepoints": [120118], "characters": "\uD835\uDD36" },
+  "&YIcy;": { "codepoints": [1031], "characters": "\u0407" },
+  "&yicy;": { "codepoints": [1111], "characters": "\u0457" },
+  "&Yopf;": { "codepoints": [120144], "characters": "\uD835\uDD50" },
+  "&yopf;": { "codepoints": [120170], "characters": "\uD835\uDD6A" },
+  "&Yscr;": { "codepoints": [119988], "characters": "\uD835\uDCB4" },
+  "&yscr;": { "codepoints": [120014], "characters": "\uD835\uDCCE" },
+  "&YUcy;": { "codepoints": [1070], "characters": "\u042E" },
+  "&yucy;": { "codepoints": [1102], "characters": "\u044E" },
+  "&yuml;": { "codepoints": [255], "characters": "\u00FF" },
+  "&yuml": { "codepoints": [255], "characters": "\u00FF" },
+  "&Yuml;": { "codepoints": [376], "characters": "\u0178" },
+  "&Zacute;": { "codepoints": [377], "characters": "\u0179" },
+  "&zacute;": { "codepoints": [378], "characters": "\u017A" },
+  "&Zcaron;": { "codepoints": [381], "characters": "\u017D" },
+  "&zcaron;": { "codepoints": [382], "characters": "\u017E" },
+  "&Zcy;": { "codepoints": [1047], "characters": "\u0417" },
+  "&zcy;": { "codepoints": [1079], "characters": "\u0437" },
+  "&Zdot;": { "codepoints": [379], "characters": "\u017B" },
+  "&zdot;": { "codepoints": [380], "characters": "\u017C" },
+  "&zeetrf;": { "codepoints": [8488], "characters": "\u2128" },
+  "&ZeroWidthSpace;": { "codepoints": [8203], "characters": "\u200B" },
+  "&Zeta;": { "codepoints": [918], "characters": "\u0396" },
+  "&zeta;": { "codepoints": [950], "characters": "\u03B6" },
+  "&zfr;": { "codepoints": [120119], "characters": "\uD835\uDD37" },
+  "&Zfr;": { "codepoints": [8488], "characters": "\u2128" },
+  "&ZHcy;": { "codepoints": [1046], "characters": "\u0416" },
+  "&zhcy;": { "codepoints": [1078], "characters": "\u0436" },
+  "&zigrarr;": { "codepoints": [8669], "characters": "\u21DD" },
+  "&zopf;": { "codepoints": [120171], "characters": "\uD835\uDD6B" },
+  "&Zopf;": { "codepoints": [8484], "characters": "\u2124" },
+  "&Zscr;": { "codepoints": [119989], "characters": "\uD835\uDCB5" },
+  "&zscr;": { "codepoints": [120015], "characters": "\uD835\uDCCF" },
+  "&zwj;": { "codepoints": [8205], "characters": "\u200D" },
+  "&zwnj;": { "codepoints": [8204], "characters": "\u200C" }
+}
diff --git a/priv/tokenizer_test_template.ex.eex b/priv/tokenizer_test_template.ex.eex
new file mode 100644
index 00000000..1d8a2c12
--- /dev/null
+++ b/priv/tokenizer_test_template.ex.eex
@@ -0,0 +1,22 @@
+defmodule Floki.HTML.Generated.Tokenizer.<%= test_name %>Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests <%= test_file %>".
+  # html5lib-tests rev: <%= revision %>
+
+  alias Floki.HTML.Tokenizer
+
+<%= for %{"input" => input, "output" => output, "description" => description} <- tests do %>
+  test <%= inspect("tokenize/1 " <> description) %> do
+    input = <%= inspect(input) %>
+    output = <%= inspect(output) %>
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+<% end %>
+end
diff --git a/src/floki_selector_lexer.xrl b/src/floki_selector_lexer.xrl
index 1a63b7c2..3827c764 100644
--- a/src/floki_selector_lexer.xrl
+++ b/src/floki_selector_lexer.xrl
@@ -1,6 +1,6 @@
 Definitions.
 
-IDENTIFIER = [-A-Za-z0-9_]+
+IDENTIFIER = [-A-Za-z0-9_]+(\\\.[-A-Za-z0-9_]+)*
 QUOTED = (\"[^"]*\"|\'[^']*\')
 PARENTESIS = \([^)]*\)
 INT = [0-9]+
@@ -9,12 +9,14 @@ ODD = (o|O)(d|D)(d|D)
 EVEN = (e|E)(v|V)(e|E)(n|N)
 PSEUDO_PATT = (\+|-)?({INT})?(n|N)((\+|-){INT})?
 SYMBOL = [\[\]*]
+ATTRIBUTE_IDENTIFIER = \s[is]\]
 W = [\s\t\r\n\f]
 
 Rules.
 
 {IDENTIFIER}                         : {token, {identifier, TokenLine, TokenChars}}.
 {QUOTED}                             : {token, {quoted, TokenLine, remove_wrapper(TokenChars)}}.
+{ATTRIBUTE_IDENTIFIER}               : {token, {attribute_identifier, TokenLine, TokenChars}}.
 {SYMBOL}                             : {token, {TokenChars, TokenLine}}.
 #{IDENTIFIER}                        : {token, {hash, TokenLine, tail(TokenChars)}}.
 \.{IDENTIFIER}                       : {token, {class, TokenLine, tail(TokenChars)}}.
diff --git a/test/floki/html/generated/tokenizer/entities_test.exs b/test/floki/html/generated/tokenizer/entities_test.exs
new file mode 100644
index 00000000..f03e7943
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/entities_test.exs
@@ -0,0 +1,783 @@
+defmodule Floki.HTML.Generated.Tokenizer.EntitiesTest do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests entities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Ambiguous ampersand." do
+    input = "&rrrraannddom;"
+    output = [["Character", "&rrrraannddom;"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 CR as hexadecimal numeric entity" do
+    input = "&#x00D;"
+    output = [["Character", "\r"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 CR as numeric entity" do
+    input = "&#013;"
+    output = [["Character", "\r"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Decimal numeric entity followed by hex character A." do
+    input = "&#97A"
+    output = [["Character", "aA"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Decimal numeric entity followed by hex character a." do
+    input = "&#97a"
+    output = [["Character", "aa"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Decimal numeric entity followed by hex character f." do
+    input = "&#97f"
+    output = [["Character", "af"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity name followed by the equals sign in an attribute value." do
+    input = "<h a='&lang='>"
+    output = [["StartTag", "h", %{"a" => "&lang="}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Semicolonless named entity 'not' followed by 'i;' in body" do
+    input = "&noti;"
+    output = [["Character", "¬i;"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Undefined named entity in attribute value ending in semicolon and whose name starts with a known entity name." do
+    input = "<h a='&noti;'>"
+    output = [["StartTag", "h", %{"a" => "&noti;"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Very long undefined named entity in body" do
+    input =
+      "&ammmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmp;"
+
+    output = [
+      [
+        "Character",
+        "&ammmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmp;"
+      ]
+    ]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 BULLET hexadecimal numeric entity." do
+    input = "&#x095;"
+    output = [["Character", "•"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 BULLET numeric entity." do
+    input = "&#0149;"
+    output = [["Character", "•"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 DAGGER hexadecimal numeric entity." do
+    input = "&#x086;"
+    output = [["Character", "†"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 DAGGER numeric entity." do
+    input = "&#0134;"
+    output = [["Character", "†"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 DOUBLE DAGGER hexadecimal numeric entity." do
+    input = "&#x087;"
+    output = [["Character", "‡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 DOUBLE DAGGER numeric entity." do
+    input = "&#0135;"
+    output = [["Character", "‡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 DOUBLE LOW-9 QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x084;"
+    output = [["Character", "„"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 DOUBLE LOW-9 QUOTATION MARK numeric entity." do
+    input = "&#0132;"
+    output = [["Character", "„"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 EM DASH hexadecimal numeric entity." do
+    input = "&#x097;"
+    output = [["Character", "—"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 EM DASH numeric entity." do
+    input = "&#0151;"
+    output = [["Character", "—"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 EN DASH hexadecimal numeric entity." do
+    input = "&#x096;"
+    output = [["Character", "–"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 EN DASH numeric entity." do
+    input = "&#0150;"
+    output = [["Character", "–"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 EURO SIGN hexadecimal numeric entity." do
+    input = "&#x080;"
+    output = [["Character", "€"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 EURO SIGN numeric entity." do
+    input = "&#0128;"
+    output = [["Character", "€"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 HORIZONTAL ELLIPSIS hexadecimal numeric entity." do
+    input = "&#x085;"
+    output = [["Character", "…"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 HORIZONTAL ELLIPSIS numeric entity." do
+    input = "&#0133;"
+    output = [["Character", "…"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LETTER S WITH CARON hexadecimal numeric entity." do
+    input = "&#x08A;"
+    output = [["Character", "Š"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LETTER S WITH CARON numeric entity." do
+    input = "&#0138;"
+    output = [["Character", "Š"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LETTER Y WITH DIAERESIS hexadecimal numeric entity." do
+    input = "&#x09F;"
+    output = [["Character", "Ÿ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LETTER Z WITH CARON hexadecimal numeric entity." do
+    input = "&#x08E;"
+    output = [["Character", "Ž"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LETTER Z WITH CARON numeric entity." do
+    input = "&#0142;"
+    output = [["Character", "Ž"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LIGATURE OE hexadecimal numeric entity." do
+    input = "&#x08C;"
+    output = [["Character", "Œ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN CAPITAL LIGATURE OE numeric entity." do
+    input = "&#0140;"
+    output = [["Character", "Œ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LETTER F WITH HOOK hexadecimal numeric entity." do
+    input = "&#x083;"
+    output = [["Character", "ƒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LETTER F WITH HOOK numeric entity." do
+    input = "&#0131;"
+    output = [["Character", "ƒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LETTER S WITH CARON hexadecimal numeric entity." do
+    input = "&#x09A;"
+    output = [["Character", "š"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LETTER S WITH CARON numeric entity." do
+    input = "&#0154;"
+    output = [["Character", "š"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LETTER Z WITH CARON hexadecimal numeric entity." do
+    input = "&#x09E;"
+    output = [["Character", "ž"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LIGATURE OE hexadecimal numeric entity." do
+    input = "&#x09C;"
+    output = [["Character", "œ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LATIN SMALL LIGATURE OE numeric entity." do
+    input = "&#0156;"
+    output = [["Character", "œ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LEFT DOUBLE QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x093;"
+    output = [["Character", "“"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LEFT DOUBLE QUOTATION MARK numeric entity." do
+    input = "&#0147;"
+    output = [["Character", "“"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LEFT SINGLE QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x091;"
+    output = [["Character", "‘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 LEFT SINGLE QUOTATION MARK numeric entity." do
+    input = "&#0145;"
+    output = [["Character", "‘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 MODIFIER LETTER CIRCUMFLEX ACCENT hexadecimal numeric entity." do
+    input = "&#x088;"
+    output = [["Character", "ˆ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 MODIFIER LETTER CIRCUMFLEX ACCENT numeric entity." do
+    input = "&#0136;"
+    output = [["Character", "ˆ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 PER MILLE SIGN hexadecimal numeric entity." do
+    input = "&#x089;"
+    output = [["Character", "‰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 PER MILLE SIGN numeric entity." do
+    input = "&#0137;"
+    output = [["Character", "‰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 REPLACEMENT CHAR hexadecimal numeric entity." do
+    input = "&#x081;"
+    output = [["Character", <<194, 129>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 REPLACEMENT CHAR numeric entity." do
+    input = "&#0129;"
+    output = [["Character", <<194, 129>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 RIGHT DOUBLE QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x094;"
+    output = [["Character", "”"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 RIGHT DOUBLE QUOTATION MARK numeric entity." do
+    input = "&#0148;"
+    output = [["Character", "”"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 RIGHT SINGLE QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x092;"
+    output = [["Character", "’"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 RIGHT SINGLE QUOTATION MARK numeric entity." do
+    input = "&#0146;"
+    output = [["Character", "’"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SINGLE LEFT-POINTING ANGLE QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x08B;"
+    output = [["Character", "‹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SINGLE LEFT-POINTING ANGLE QUOTATION MARK numeric entity." do
+    input = "&#0139;"
+    output = [["Character", "‹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SINGLE LOW-9 QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x082;"
+    output = [["Character", "‚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SINGLE LOW-9 QUOTATION MARK numeric entity." do
+    input = "&#0130;"
+    output = [["Character", "‚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SINGLE RIGHT-POINTING ANGLE QUOTATION MARK hexadecimal numeric entity." do
+    input = "&#x09B;"
+    output = [["Character", "›"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SINGLE RIGHT-POINTING ANGLE QUOTATION MARK numeric entity." do
+    input = "&#0155;"
+    output = [["Character", "›"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SMALL TILDE hexadecimal numeric entity." do
+    input = "&#x098;"
+    output = [["Character", "˜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 SMALL TILDE numeric entity." do
+    input = "&#0152;"
+    output = [["Character", "˜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 TRADE MARK SIGN hexadecimal numeric entity." do
+    input = "&#x099;"
+    output = [["Character", "™"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Windows-1252 TRADE MARK SIGN numeric entity." do
+    input = "&#0153;"
+    output = [["Character", "™"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part10_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part10_test.exs
new file mode 100644
index 00000000..48618b2d
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part10_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart10Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: emsp14 without a semi-colon" do
+    input = "&emsp14"
+    output = [["Character", "&emsp14"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eng without a semi-colon" do
+    input = "&eng"
+    output = [["Character", "&eng"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ensp without a semi-colon" do
+    input = "&ensp"
+    output = [["Character", "&ensp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eogon without a semi-colon" do
+    input = "&eogon"
+    output = [["Character", "&eogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eopf without a semi-colon" do
+    input = "&eopf"
+    output = [["Character", "&eopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: epar without a semi-colon" do
+    input = "&epar"
+    output = [["Character", "&epar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eparsl without a semi-colon" do
+    input = "&eparsl"
+    output = [["Character", "&eparsl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eplus without a semi-colon" do
+    input = "&eplus"
+    output = [["Character", "&eplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: epsi without a semi-colon" do
+    input = "&epsi"
+    output = [["Character", "&epsi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: epsilon without a semi-colon" do
+    input = "&epsilon"
+    output = [["Character", "&epsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: epsiv without a semi-colon" do
+    input = "&epsiv"
+    output = [["Character", "&epsiv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eqcirc without a semi-colon" do
+    input = "&eqcirc"
+    output = [["Character", "&eqcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eqcolon without a semi-colon" do
+    input = "&eqcolon"
+    output = [["Character", "&eqcolon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eqsim without a semi-colon" do
+    input = "&eqsim"
+    output = [["Character", "&eqsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eqslantgtr without a semi-colon" do
+    input = "&eqslantgtr"
+    output = [["Character", "&eqslantgtr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eqslantless without a semi-colon" do
+    input = "&eqslantless"
+    output = [["Character", "&eqslantless"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: equals without a semi-colon" do
+    input = "&equals"
+    output = [["Character", "&equals"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: equest without a semi-colon" do
+    input = "&equest"
+    output = [["Character", "&equest"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: equiv without a semi-colon" do
+    input = "&equiv"
+    output = [["Character", "&equiv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: equivDD without a semi-colon" do
+    input = "&equivDD"
+    output = [["Character", "&equivDD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eqvparsl without a semi-colon" do
+    input = "&eqvparsl"
+    output = [["Character", "&eqvparsl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: erDot without a semi-colon" do
+    input = "&erDot"
+    output = [["Character", "&erDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: erarr without a semi-colon" do
+    input = "&erarr"
+    output = [["Character", "&erarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: escr without a semi-colon" do
+    input = "&escr"
+    output = [["Character", "&escr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: esdot without a semi-colon" do
+    input = "&esdot"
+    output = [["Character", "&esdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: esim without a semi-colon" do
+    input = "&esim"
+    output = [["Character", "&esim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eta without a semi-colon" do
+    input = "&eta"
+    output = [["Character", "&eta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: euro without a semi-colon" do
+    input = "&euro"
+    output = [["Character", "&euro"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: excl without a semi-colon" do
+    input = "&excl"
+    output = [["Character", "&excl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: exist without a semi-colon" do
+    input = "&exist"
+    output = [["Character", "&exist"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: expectation without a semi-colon" do
+    input = "&expectation"
+    output = [["Character", "&expectation"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: exponentiale without a semi-colon" do
+    input = "&exponentiale"
+    output = [["Character", "&exponentiale"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fallingdotseq without a semi-colon" do
+    input = "&fallingdotseq"
+    output = [["Character", "&fallingdotseq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fcy without a semi-colon" do
+    input = "&fcy"
+    output = [["Character", "&fcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: female without a semi-colon" do
+    input = "&female"
+    output = [["Character", "&female"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ffilig without a semi-colon" do
+    input = "&ffilig"
+    output = [["Character", "&ffilig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fflig without a semi-colon" do
+    input = "&fflig"
+    output = [["Character", "&fflig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ffllig without a semi-colon" do
+    input = "&ffllig"
+    output = [["Character", "&ffllig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ffr without a semi-colon" do
+    input = "&ffr"
+    output = [["Character", "&ffr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: filig without a semi-colon" do
+    input = "&filig"
+    output = [["Character", "&filig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fjlig without a semi-colon" do
+    input = "&fjlig"
+    output = [["Character", "&fjlig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: flat without a semi-colon" do
+    input = "&flat"
+    output = [["Character", "&flat"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fllig without a semi-colon" do
+    input = "&fllig"
+    output = [["Character", "&fllig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fltns without a semi-colon" do
+    input = "&fltns"
+    output = [["Character", "&fltns"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fnof without a semi-colon" do
+    input = "&fnof"
+    output = [["Character", "&fnof"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fopf without a semi-colon" do
+    input = "&fopf"
+    output = [["Character", "&fopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: forall without a semi-colon" do
+    input = "&forall"
+    output = [["Character", "&forall"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fork without a semi-colon" do
+    input = "&fork"
+    output = [["Character", "&fork"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: forkv without a semi-colon" do
+    input = "&forkv"
+    output = [["Character", "&forkv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fpartint without a semi-colon" do
+    input = "&fpartint"
+    output = [["Character", "&fpartint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac13 without a semi-colon" do
+    input = "&frac13"
+    output = [["Character", "&frac13"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac15 without a semi-colon" do
+    input = "&frac15"
+    output = [["Character", "&frac15"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac16 without a semi-colon" do
+    input = "&frac16"
+    output = [["Character", "&frac16"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac18 without a semi-colon" do
+    input = "&frac18"
+    output = [["Character", "&frac18"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac23 without a semi-colon" do
+    input = "&frac23"
+    output = [["Character", "&frac23"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac25 without a semi-colon" do
+    input = "&frac25"
+    output = [["Character", "&frac25"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac35 without a semi-colon" do
+    input = "&frac35"
+    output = [["Character", "&frac35"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac38 without a semi-colon" do
+    input = "&frac38"
+    output = [["Character", "&frac38"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac45 without a semi-colon" do
+    input = "&frac45"
+    output = [["Character", "&frac45"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac56 without a semi-colon" do
+    input = "&frac56"
+    output = [["Character", "&frac56"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac58 without a semi-colon" do
+    input = "&frac58"
+    output = [["Character", "&frac58"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frac78 without a semi-colon" do
+    input = "&frac78"
+    output = [["Character", "&frac78"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frasl without a semi-colon" do
+    input = "&frasl"
+    output = [["Character", "&frasl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: frown without a semi-colon" do
+    input = "&frown"
+    output = [["Character", "&frown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: fscr without a semi-colon" do
+    input = "&fscr"
+    output = [["Character", "&fscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gE without a semi-colon" do
+    input = "&gE"
+    output = [["Character", "&gE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gEl without a semi-colon" do
+    input = "&gEl"
+    output = [["Character", "&gEl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gacute without a semi-colon" do
+    input = "&gacute"
+    output = [["Character", "&gacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gamma without a semi-colon" do
+    input = "&gamma"
+    output = [["Character", "&gamma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gammad without a semi-colon" do
+    input = "&gammad"
+    output = [["Character", "&gammad"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gap without a semi-colon" do
+    input = "&gap"
+    output = [["Character", "&gap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gbreve without a semi-colon" do
+    input = "&gbreve"
+    output = [["Character", "&gbreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gcirc without a semi-colon" do
+    input = "&gcirc"
+    output = [["Character", "&gcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gcy without a semi-colon" do
+    input = "&gcy"
+    output = [["Character", "&gcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gdot without a semi-colon" do
+    input = "&gdot"
+    output = [["Character", "&gdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ge without a semi-colon" do
+    input = "&ge"
+    output = [["Character", "&ge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gel without a semi-colon" do
+    input = "&gel"
+    output = [["Character", "&gel"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: geq without a semi-colon" do
+    input = "&geq"
+    output = [["Character", "&geq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: geqq without a semi-colon" do
+    input = "&geqq"
+    output = [["Character", "&geqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: geqslant without a semi-colon" do
+    input = "&geqslant"
+    output = [["Character", "&geqslant"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ges without a semi-colon" do
+    input = "&ges"
+    output = [["Character", "&ges"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gescc without a semi-colon" do
+    input = "&gescc"
+    output = [["Character", "&gescc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gesdot without a semi-colon" do
+    input = "&gesdot"
+    output = [["Character", "&gesdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gesdoto without a semi-colon" do
+    input = "&gesdoto"
+    output = [["Character", "&gesdoto"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gesdotol without a semi-colon" do
+    input = "&gesdotol"
+    output = [["Character", "&gesdotol"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gesl without a semi-colon" do
+    input = "&gesl"
+    output = [["Character", "&gesl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gesles without a semi-colon" do
+    input = "&gesles"
+    output = [["Character", "&gesles"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gfr without a semi-colon" do
+    input = "&gfr"
+    output = [["Character", "&gfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gg without a semi-colon" do
+    input = "&gg"
+    output = [["Character", "&gg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ggg without a semi-colon" do
+    input = "&ggg"
+    output = [["Character", "&ggg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gimel without a semi-colon" do
+    input = "&gimel"
+    output = [["Character", "&gimel"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gjcy without a semi-colon" do
+    input = "&gjcy"
+    output = [["Character", "&gjcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gl without a semi-colon" do
+    input = "&gl"
+    output = [["Character", "&gl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: glE without a semi-colon" do
+    input = "&glE"
+    output = [["Character", "&glE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gla without a semi-colon" do
+    input = "&gla"
+    output = [["Character", "&gla"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: glj without a semi-colon" do
+    input = "&glj"
+    output = [["Character", "&glj"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gnE without a semi-colon" do
+    input = "&gnE"
+    output = [["Character", "&gnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gnap without a semi-colon" do
+    input = "&gnap"
+    output = [["Character", "&gnap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gnapprox without a semi-colon" do
+    input = "&gnapprox"
+    output = [["Character", "&gnapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gne without a semi-colon" do
+    input = "&gne"
+    output = [["Character", "&gne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part11_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part11_test.exs
new file mode 100644
index 00000000..1c92abc0
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part11_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart11Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: gneq without a semi-colon" do
+    input = "&gneq"
+    output = [["Character", "&gneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gneqq without a semi-colon" do
+    input = "&gneqq"
+    output = [["Character", "&gneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gnsim without a semi-colon" do
+    input = "&gnsim"
+    output = [["Character", "&gnsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gopf without a semi-colon" do
+    input = "&gopf"
+    output = [["Character", "&gopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: grave without a semi-colon" do
+    input = "&grave"
+    output = [["Character", "&grave"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gscr without a semi-colon" do
+    input = "&gscr"
+    output = [["Character", "&gscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gsim without a semi-colon" do
+    input = "&gsim"
+    output = [["Character", "&gsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gsime without a semi-colon" do
+    input = "&gsime"
+    output = [["Character", "&gsime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gsiml without a semi-colon" do
+    input = "&gsiml"
+    output = [["Character", "&gsiml"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gvertneqq without a semi-colon" do
+    input = "&gvertneqq"
+    output = [["Character", "&gvertneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: gvnE without a semi-colon" do
+    input = "&gvnE"
+    output = [["Character", "&gvnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hArr without a semi-colon" do
+    input = "&hArr"
+    output = [["Character", "&hArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hairsp without a semi-colon" do
+    input = "&hairsp"
+    output = [["Character", "&hairsp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: half without a semi-colon" do
+    input = "&half"
+    output = [["Character", "&half"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hamilt without a semi-colon" do
+    input = "&hamilt"
+    output = [["Character", "&hamilt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hardcy without a semi-colon" do
+    input = "&hardcy"
+    output = [["Character", "&hardcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: harr without a semi-colon" do
+    input = "&harr"
+    output = [["Character", "&harr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: harrcir without a semi-colon" do
+    input = "&harrcir"
+    output = [["Character", "&harrcir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: harrw without a semi-colon" do
+    input = "&harrw"
+    output = [["Character", "&harrw"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hbar without a semi-colon" do
+    input = "&hbar"
+    output = [["Character", "&hbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hcirc without a semi-colon" do
+    input = "&hcirc"
+    output = [["Character", "&hcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hearts without a semi-colon" do
+    input = "&hearts"
+    output = [["Character", "&hearts"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: heartsuit without a semi-colon" do
+    input = "&heartsuit"
+    output = [["Character", "&heartsuit"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hellip without a semi-colon" do
+    input = "&hellip"
+    output = [["Character", "&hellip"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hercon without a semi-colon" do
+    input = "&hercon"
+    output = [["Character", "&hercon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hfr without a semi-colon" do
+    input = "&hfr"
+    output = [["Character", "&hfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hksearow without a semi-colon" do
+    input = "&hksearow"
+    output = [["Character", "&hksearow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hkswarow without a semi-colon" do
+    input = "&hkswarow"
+    output = [["Character", "&hkswarow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hoarr without a semi-colon" do
+    input = "&hoarr"
+    output = [["Character", "&hoarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: homtht without a semi-colon" do
+    input = "&homtht"
+    output = [["Character", "&homtht"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hookleftarrow without a semi-colon" do
+    input = "&hookleftarrow"
+    output = [["Character", "&hookleftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hookrightarrow without a semi-colon" do
+    input = "&hookrightarrow"
+    output = [["Character", "&hookrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hopf without a semi-colon" do
+    input = "&hopf"
+    output = [["Character", "&hopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: horbar without a semi-colon" do
+    input = "&horbar"
+    output = [["Character", "&horbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hscr without a semi-colon" do
+    input = "&hscr"
+    output = [["Character", "&hscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hslash without a semi-colon" do
+    input = "&hslash"
+    output = [["Character", "&hslash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hstrok without a semi-colon" do
+    input = "&hstrok"
+    output = [["Character", "&hstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hybull without a semi-colon" do
+    input = "&hybull"
+    output = [["Character", "&hybull"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: hyphen without a semi-colon" do
+    input = "&hyphen"
+    output = [["Character", "&hyphen"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ic without a semi-colon" do
+    input = "&ic"
+    output = [["Character", "&ic"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: icy without a semi-colon" do
+    input = "&icy"
+    output = [["Character", "&icy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iecy without a semi-colon" do
+    input = "&iecy"
+    output = [["Character", "&iecy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iff without a semi-colon" do
+    input = "&iff"
+    output = [["Character", "&iff"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ifr without a semi-colon" do
+    input = "&ifr"
+    output = [["Character", "&ifr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ii without a semi-colon" do
+    input = "&ii"
+    output = [["Character", "&ii"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iiiint without a semi-colon" do
+    input = "&iiiint"
+    output = [["Character", "&iiiint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iiint without a semi-colon" do
+    input = "&iiint"
+    output = [["Character", "&iiint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iinfin without a semi-colon" do
+    input = "&iinfin"
+    output = [["Character", "&iinfin"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iiota without a semi-colon" do
+    input = "&iiota"
+    output = [["Character", "&iiota"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ijlig without a semi-colon" do
+    input = "&ijlig"
+    output = [["Character", "&ijlig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: imacr without a semi-colon" do
+    input = "&imacr"
+    output = [["Character", "&imacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: image without a semi-colon" do
+    input = "&image"
+    output = [["Character", "&image"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: imagline without a semi-colon" do
+    input = "&imagline"
+    output = [["Character", "&imagline"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: imagpart without a semi-colon" do
+    input = "&imagpart"
+    output = [["Character", "&imagpart"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: imath without a semi-colon" do
+    input = "&imath"
+    output = [["Character", "&imath"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: imof without a semi-colon" do
+    input = "&imof"
+    output = [["Character", "&imof"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: imped without a semi-colon" do
+    input = "&imped"
+    output = [["Character", "&imped"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: in without a semi-colon" do
+    input = "&in"
+    output = [["Character", "&in"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: incare without a semi-colon" do
+    input = "&incare"
+    output = [["Character", "&incare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: infin without a semi-colon" do
+    input = "&infin"
+    output = [["Character", "&infin"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: infintie without a semi-colon" do
+    input = "&infintie"
+    output = [["Character", "&infintie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: inodot without a semi-colon" do
+    input = "&inodot"
+    output = [["Character", "&inodot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: int without a semi-colon" do
+    input = "&int"
+    output = [["Character", "&int"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: intcal without a semi-colon" do
+    input = "&intcal"
+    output = [["Character", "&intcal"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: integers without a semi-colon" do
+    input = "&integers"
+    output = [["Character", "&integers"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: intercal without a semi-colon" do
+    input = "&intercal"
+    output = [["Character", "&intercal"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: intlarhk without a semi-colon" do
+    input = "&intlarhk"
+    output = [["Character", "&intlarhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: intprod without a semi-colon" do
+    input = "&intprod"
+    output = [["Character", "&intprod"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iocy without a semi-colon" do
+    input = "&iocy"
+    output = [["Character", "&iocy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iogon without a semi-colon" do
+    input = "&iogon"
+    output = [["Character", "&iogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iopf without a semi-colon" do
+    input = "&iopf"
+    output = [["Character", "&iopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iota without a semi-colon" do
+    input = "&iota"
+    output = [["Character", "&iota"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iprod without a semi-colon" do
+    input = "&iprod"
+    output = [["Character", "&iprod"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iscr without a semi-colon" do
+    input = "&iscr"
+    output = [["Character", "&iscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: isin without a semi-colon" do
+    input = "&isin"
+    output = [["Character", "&isin"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: isinE without a semi-colon" do
+    input = "&isinE"
+    output = [["Character", "&isinE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: isindot without a semi-colon" do
+    input = "&isindot"
+    output = [["Character", "&isindot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: isins without a semi-colon" do
+    input = "&isins"
+    output = [["Character", "&isins"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: isinsv without a semi-colon" do
+    input = "&isinsv"
+    output = [["Character", "&isinsv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: isinv without a semi-colon" do
+    input = "&isinv"
+    output = [["Character", "&isinv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: it without a semi-colon" do
+    input = "&it"
+    output = [["Character", "&it"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: itilde without a semi-colon" do
+    input = "&itilde"
+    output = [["Character", "&itilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: iukcy without a semi-colon" do
+    input = "&iukcy"
+    output = [["Character", "&iukcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jcirc without a semi-colon" do
+    input = "&jcirc"
+    output = [["Character", "&jcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jcy without a semi-colon" do
+    input = "&jcy"
+    output = [["Character", "&jcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jfr without a semi-colon" do
+    input = "&jfr"
+    output = [["Character", "&jfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jmath without a semi-colon" do
+    input = "&jmath"
+    output = [["Character", "&jmath"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jopf without a semi-colon" do
+    input = "&jopf"
+    output = [["Character", "&jopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jscr without a semi-colon" do
+    input = "&jscr"
+    output = [["Character", "&jscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jsercy without a semi-colon" do
+    input = "&jsercy"
+    output = [["Character", "&jsercy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: jukcy without a semi-colon" do
+    input = "&jukcy"
+    output = [["Character", "&jukcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kappa without a semi-colon" do
+    input = "&kappa"
+    output = [["Character", "&kappa"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kappav without a semi-colon" do
+    input = "&kappav"
+    output = [["Character", "&kappav"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kcedil without a semi-colon" do
+    input = "&kcedil"
+    output = [["Character", "&kcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kcy without a semi-colon" do
+    input = "&kcy"
+    output = [["Character", "&kcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kfr without a semi-colon" do
+    input = "&kfr"
+    output = [["Character", "&kfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kgreen without a semi-colon" do
+    input = "&kgreen"
+    output = [["Character", "&kgreen"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: khcy without a semi-colon" do
+    input = "&khcy"
+    output = [["Character", "&khcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kjcy without a semi-colon" do
+    input = "&kjcy"
+    output = [["Character", "&kjcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: kopf without a semi-colon" do
+    input = "&kopf"
+    output = [["Character", "&kopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part12_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part12_test.exs
new file mode 100644
index 00000000..8a8f95c6
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part12_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart12Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: kscr without a semi-colon" do
+    input = "&kscr"
+    output = [["Character", "&kscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lAarr without a semi-colon" do
+    input = "&lAarr"
+    output = [["Character", "&lAarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lArr without a semi-colon" do
+    input = "&lArr"
+    output = [["Character", "&lArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lAtail without a semi-colon" do
+    input = "&lAtail"
+    output = [["Character", "&lAtail"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lBarr without a semi-colon" do
+    input = "&lBarr"
+    output = [["Character", "&lBarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lE without a semi-colon" do
+    input = "&lE"
+    output = [["Character", "&lE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lEg without a semi-colon" do
+    input = "&lEg"
+    output = [["Character", "&lEg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lHar without a semi-colon" do
+    input = "&lHar"
+    output = [["Character", "&lHar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lacute without a semi-colon" do
+    input = "&lacute"
+    output = [["Character", "&lacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: laemptyv without a semi-colon" do
+    input = "&laemptyv"
+    output = [["Character", "&laemptyv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lagran without a semi-colon" do
+    input = "&lagran"
+    output = [["Character", "&lagran"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lambda without a semi-colon" do
+    input = "&lambda"
+    output = [["Character", "&lambda"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lang without a semi-colon" do
+    input = "&lang"
+    output = [["Character", "&lang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: langd without a semi-colon" do
+    input = "&langd"
+    output = [["Character", "&langd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: langle without a semi-colon" do
+    input = "&langle"
+    output = [["Character", "&langle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lap without a semi-colon" do
+    input = "&lap"
+    output = [["Character", "&lap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larr without a semi-colon" do
+    input = "&larr"
+    output = [["Character", "&larr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrb without a semi-colon" do
+    input = "&larrb"
+    output = [["Character", "&larrb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrbfs without a semi-colon" do
+    input = "&larrbfs"
+    output = [["Character", "&larrbfs"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrfs without a semi-colon" do
+    input = "&larrfs"
+    output = [["Character", "&larrfs"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrhk without a semi-colon" do
+    input = "&larrhk"
+    output = [["Character", "&larrhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrlp without a semi-colon" do
+    input = "&larrlp"
+    output = [["Character", "&larrlp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrpl without a semi-colon" do
+    input = "&larrpl"
+    output = [["Character", "&larrpl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrsim without a semi-colon" do
+    input = "&larrsim"
+    output = [["Character", "&larrsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: larrtl without a semi-colon" do
+    input = "&larrtl"
+    output = [["Character", "&larrtl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lat without a semi-colon" do
+    input = "&lat"
+    output = [["Character", "&lat"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: latail without a semi-colon" do
+    input = "&latail"
+    output = [["Character", "&latail"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: late without a semi-colon" do
+    input = "&late"
+    output = [["Character", "&late"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lates without a semi-colon" do
+    input = "&lates"
+    output = [["Character", "&lates"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbarr without a semi-colon" do
+    input = "&lbarr"
+    output = [["Character", "&lbarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbbrk without a semi-colon" do
+    input = "&lbbrk"
+    output = [["Character", "&lbbrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbrace without a semi-colon" do
+    input = "&lbrace"
+    output = [["Character", "&lbrace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbrack without a semi-colon" do
+    input = "&lbrack"
+    output = [["Character", "&lbrack"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbrke without a semi-colon" do
+    input = "&lbrke"
+    output = [["Character", "&lbrke"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbrksld without a semi-colon" do
+    input = "&lbrksld"
+    output = [["Character", "&lbrksld"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lbrkslu without a semi-colon" do
+    input = "&lbrkslu"
+    output = [["Character", "&lbrkslu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lcaron without a semi-colon" do
+    input = "&lcaron"
+    output = [["Character", "&lcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lcedil without a semi-colon" do
+    input = "&lcedil"
+    output = [["Character", "&lcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lceil without a semi-colon" do
+    input = "&lceil"
+    output = [["Character", "&lceil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lcub without a semi-colon" do
+    input = "&lcub"
+    output = [["Character", "&lcub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lcy without a semi-colon" do
+    input = "&lcy"
+    output = [["Character", "&lcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ldca without a semi-colon" do
+    input = "&ldca"
+    output = [["Character", "&ldca"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ldquo without a semi-colon" do
+    input = "&ldquo"
+    output = [["Character", "&ldquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ldquor without a semi-colon" do
+    input = "&ldquor"
+    output = [["Character", "&ldquor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ldrdhar without a semi-colon" do
+    input = "&ldrdhar"
+    output = [["Character", "&ldrdhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ldrushar without a semi-colon" do
+    input = "&ldrushar"
+    output = [["Character", "&ldrushar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ldsh without a semi-colon" do
+    input = "&ldsh"
+    output = [["Character", "&ldsh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: le without a semi-colon" do
+    input = "&le"
+    output = [["Character", "&le"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftarrow without a semi-colon" do
+    input = "&leftarrow"
+    output = [["Character", "&leftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftarrowtail without a semi-colon" do
+    input = "&leftarrowtail"
+    output = [["Character", "&leftarrowtail"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftharpoondown without a semi-colon" do
+    input = "&leftharpoondown"
+    output = [["Character", "&leftharpoondown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftharpoonup without a semi-colon" do
+    input = "&leftharpoonup"
+    output = [["Character", "&leftharpoonup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftleftarrows without a semi-colon" do
+    input = "&leftleftarrows"
+    output = [["Character", "&leftleftarrows"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftrightarrow without a semi-colon" do
+    input = "&leftrightarrow"
+    output = [["Character", "&leftrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftrightarrows without a semi-colon" do
+    input = "&leftrightarrows"
+    output = [["Character", "&leftrightarrows"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftrightharpoons without a semi-colon" do
+    input = "&leftrightharpoons"
+    output = [["Character", "&leftrightharpoons"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftrightsquigarrow without a semi-colon" do
+    input = "&leftrightsquigarrow"
+    output = [["Character", "&leftrightsquigarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leftthreetimes without a semi-colon" do
+    input = "&leftthreetimes"
+    output = [["Character", "&leftthreetimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leg without a semi-colon" do
+    input = "&leg"
+    output = [["Character", "&leg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leq without a semi-colon" do
+    input = "&leq"
+    output = [["Character", "&leq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leqq without a semi-colon" do
+    input = "&leqq"
+    output = [["Character", "&leqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: leqslant without a semi-colon" do
+    input = "&leqslant"
+    output = [["Character", "&leqslant"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: les without a semi-colon" do
+    input = "&les"
+    output = [["Character", "&les"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lescc without a semi-colon" do
+    input = "&lescc"
+    output = [["Character", "&lescc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesdot without a semi-colon" do
+    input = "&lesdot"
+    output = [["Character", "&lesdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesdoto without a semi-colon" do
+    input = "&lesdoto"
+    output = [["Character", "&lesdoto"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesdotor without a semi-colon" do
+    input = "&lesdotor"
+    output = [["Character", "&lesdotor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesg without a semi-colon" do
+    input = "&lesg"
+    output = [["Character", "&lesg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesges without a semi-colon" do
+    input = "&lesges"
+    output = [["Character", "&lesges"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lessapprox without a semi-colon" do
+    input = "&lessapprox"
+    output = [["Character", "&lessapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lessdot without a semi-colon" do
+    input = "&lessdot"
+    output = [["Character", "&lessdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesseqgtr without a semi-colon" do
+    input = "&lesseqgtr"
+    output = [["Character", "&lesseqgtr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesseqqgtr without a semi-colon" do
+    input = "&lesseqqgtr"
+    output = [["Character", "&lesseqqgtr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lessgtr without a semi-colon" do
+    input = "&lessgtr"
+    output = [["Character", "&lessgtr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lesssim without a semi-colon" do
+    input = "&lesssim"
+    output = [["Character", "&lesssim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lfisht without a semi-colon" do
+    input = "&lfisht"
+    output = [["Character", "&lfisht"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lfloor without a semi-colon" do
+    input = "&lfloor"
+    output = [["Character", "&lfloor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lfr without a semi-colon" do
+    input = "&lfr"
+    output = [["Character", "&lfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lg without a semi-colon" do
+    input = "&lg"
+    output = [["Character", "&lg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lgE without a semi-colon" do
+    input = "&lgE"
+    output = [["Character", "&lgE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lhard without a semi-colon" do
+    input = "&lhard"
+    output = [["Character", "&lhard"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lharu without a semi-colon" do
+    input = "&lharu"
+    output = [["Character", "&lharu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lharul without a semi-colon" do
+    input = "&lharul"
+    output = [["Character", "&lharul"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lhblk without a semi-colon" do
+    input = "&lhblk"
+    output = [["Character", "&lhblk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ljcy without a semi-colon" do
+    input = "&ljcy"
+    output = [["Character", "&ljcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ll without a semi-colon" do
+    input = "&ll"
+    output = [["Character", "&ll"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: llarr without a semi-colon" do
+    input = "&llarr"
+    output = [["Character", "&llarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: llcorner without a semi-colon" do
+    input = "&llcorner"
+    output = [["Character", "&llcorner"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: llhard without a semi-colon" do
+    input = "&llhard"
+    output = [["Character", "&llhard"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lltri without a semi-colon" do
+    input = "&lltri"
+    output = [["Character", "&lltri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lmidot without a semi-colon" do
+    input = "&lmidot"
+    output = [["Character", "&lmidot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lmoust without a semi-colon" do
+    input = "&lmoust"
+    output = [["Character", "&lmoust"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lmoustache without a semi-colon" do
+    input = "&lmoustache"
+    output = [["Character", "&lmoustache"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lnE without a semi-colon" do
+    input = "&lnE"
+    output = [["Character", "&lnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lnap without a semi-colon" do
+    input = "&lnap"
+    output = [["Character", "&lnap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lnapprox without a semi-colon" do
+    input = "&lnapprox"
+    output = [["Character", "&lnapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lne without a semi-colon" do
+    input = "&lne"
+    output = [["Character", "&lne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lneq without a semi-colon" do
+    input = "&lneq"
+    output = [["Character", "&lneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lneqq without a semi-colon" do
+    input = "&lneqq"
+    output = [["Character", "&lneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lnsim without a semi-colon" do
+    input = "&lnsim"
+    output = [["Character", "&lnsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part13_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part13_test.exs
new file mode 100644
index 00000000..426af550
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part13_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart13Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: loang without a semi-colon" do
+    input = "&loang"
+    output = [["Character", "&loang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: loarr without a semi-colon" do
+    input = "&loarr"
+    output = [["Character", "&loarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lobrk without a semi-colon" do
+    input = "&lobrk"
+    output = [["Character", "&lobrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: longleftarrow without a semi-colon" do
+    input = "&longleftarrow"
+    output = [["Character", "&longleftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: longleftrightarrow without a semi-colon" do
+    input = "&longleftrightarrow"
+    output = [["Character", "&longleftrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: longmapsto without a semi-colon" do
+    input = "&longmapsto"
+    output = [["Character", "&longmapsto"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: longrightarrow without a semi-colon" do
+    input = "&longrightarrow"
+    output = [["Character", "&longrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: looparrowleft without a semi-colon" do
+    input = "&looparrowleft"
+    output = [["Character", "&looparrowleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: looparrowright without a semi-colon" do
+    input = "&looparrowright"
+    output = [["Character", "&looparrowright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lopar without a semi-colon" do
+    input = "&lopar"
+    output = [["Character", "&lopar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lopf without a semi-colon" do
+    input = "&lopf"
+    output = [["Character", "&lopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: loplus without a semi-colon" do
+    input = "&loplus"
+    output = [["Character", "&loplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lotimes without a semi-colon" do
+    input = "&lotimes"
+    output = [["Character", "&lotimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lowast without a semi-colon" do
+    input = "&lowast"
+    output = [["Character", "&lowast"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lowbar without a semi-colon" do
+    input = "&lowbar"
+    output = [["Character", "&lowbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: loz without a semi-colon" do
+    input = "&loz"
+    output = [["Character", "&loz"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lozenge without a semi-colon" do
+    input = "&lozenge"
+    output = [["Character", "&lozenge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lozf without a semi-colon" do
+    input = "&lozf"
+    output = [["Character", "&lozf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lpar without a semi-colon" do
+    input = "&lpar"
+    output = [["Character", "&lpar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lparlt without a semi-colon" do
+    input = "&lparlt"
+    output = [["Character", "&lparlt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lrarr without a semi-colon" do
+    input = "&lrarr"
+    output = [["Character", "&lrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lrcorner without a semi-colon" do
+    input = "&lrcorner"
+    output = [["Character", "&lrcorner"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lrhar without a semi-colon" do
+    input = "&lrhar"
+    output = [["Character", "&lrhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lrhard without a semi-colon" do
+    input = "&lrhard"
+    output = [["Character", "&lrhard"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lrm without a semi-colon" do
+    input = "&lrm"
+    output = [["Character", "&lrm"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lrtri without a semi-colon" do
+    input = "&lrtri"
+    output = [["Character", "&lrtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsaquo without a semi-colon" do
+    input = "&lsaquo"
+    output = [["Character", "&lsaquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lscr without a semi-colon" do
+    input = "&lscr"
+    output = [["Character", "&lscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsh without a semi-colon" do
+    input = "&lsh"
+    output = [["Character", "&lsh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsim without a semi-colon" do
+    input = "&lsim"
+    output = [["Character", "&lsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsime without a semi-colon" do
+    input = "&lsime"
+    output = [["Character", "&lsime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsimg without a semi-colon" do
+    input = "&lsimg"
+    output = [["Character", "&lsimg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsqb without a semi-colon" do
+    input = "&lsqb"
+    output = [["Character", "&lsqb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsquo without a semi-colon" do
+    input = "&lsquo"
+    output = [["Character", "&lsquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lsquor without a semi-colon" do
+    input = "&lsquor"
+    output = [["Character", "&lsquor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lstrok without a semi-colon" do
+    input = "&lstrok"
+    output = [["Character", "&lstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lurdshar without a semi-colon" do
+    input = "&lurdshar"
+    output = [["Character", "&lurdshar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: luruhar without a semi-colon" do
+    input = "&luruhar"
+    output = [["Character", "&luruhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lvertneqq without a semi-colon" do
+    input = "&lvertneqq"
+    output = [["Character", "&lvertneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: lvnE without a semi-colon" do
+    input = "&lvnE"
+    output = [["Character", "&lvnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mDDot without a semi-colon" do
+    input = "&mDDot"
+    output = [["Character", "&mDDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: male without a semi-colon" do
+    input = "&male"
+    output = [["Character", "&male"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: malt without a semi-colon" do
+    input = "&malt"
+    output = [["Character", "&malt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: maltese without a semi-colon" do
+    input = "&maltese"
+    output = [["Character", "&maltese"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: map without a semi-colon" do
+    input = "&map"
+    output = [["Character", "&map"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mapsto without a semi-colon" do
+    input = "&mapsto"
+    output = [["Character", "&mapsto"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mapstodown without a semi-colon" do
+    input = "&mapstodown"
+    output = [["Character", "&mapstodown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mapstoleft without a semi-colon" do
+    input = "&mapstoleft"
+    output = [["Character", "&mapstoleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mapstoup without a semi-colon" do
+    input = "&mapstoup"
+    output = [["Character", "&mapstoup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: marker without a semi-colon" do
+    input = "&marker"
+    output = [["Character", "&marker"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mcomma without a semi-colon" do
+    input = "&mcomma"
+    output = [["Character", "&mcomma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mcy without a semi-colon" do
+    input = "&mcy"
+    output = [["Character", "&mcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mdash without a semi-colon" do
+    input = "&mdash"
+    output = [["Character", "&mdash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: measuredangle without a semi-colon" do
+    input = "&measuredangle"
+    output = [["Character", "&measuredangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mfr without a semi-colon" do
+    input = "&mfr"
+    output = [["Character", "&mfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mho without a semi-colon" do
+    input = "&mho"
+    output = [["Character", "&mho"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mid without a semi-colon" do
+    input = "&mid"
+    output = [["Character", "&mid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: midast without a semi-colon" do
+    input = "&midast"
+    output = [["Character", "&midast"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: midcir without a semi-colon" do
+    input = "&midcir"
+    output = [["Character", "&midcir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: minus without a semi-colon" do
+    input = "&minus"
+    output = [["Character", "&minus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: minusb without a semi-colon" do
+    input = "&minusb"
+    output = [["Character", "&minusb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: minusd without a semi-colon" do
+    input = "&minusd"
+    output = [["Character", "&minusd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: minusdu without a semi-colon" do
+    input = "&minusdu"
+    output = [["Character", "&minusdu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mlcp without a semi-colon" do
+    input = "&mlcp"
+    output = [["Character", "&mlcp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mldr without a semi-colon" do
+    input = "&mldr"
+    output = [["Character", "&mldr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mnplus without a semi-colon" do
+    input = "&mnplus"
+    output = [["Character", "&mnplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: models without a semi-colon" do
+    input = "&models"
+    output = [["Character", "&models"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mopf without a semi-colon" do
+    input = "&mopf"
+    output = [["Character", "&mopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mp without a semi-colon" do
+    input = "&mp"
+    output = [["Character", "&mp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mscr without a semi-colon" do
+    input = "&mscr"
+    output = [["Character", "&mscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mstpos without a semi-colon" do
+    input = "&mstpos"
+    output = [["Character", "&mstpos"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mu without a semi-colon" do
+    input = "&mu"
+    output = [["Character", "&mu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: multimap without a semi-colon" do
+    input = "&multimap"
+    output = [["Character", "&multimap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: mumap without a semi-colon" do
+    input = "&mumap"
+    output = [["Character", "&mumap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nGg without a semi-colon" do
+    input = "&nGg"
+    output = [["Character", "&nGg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nGt without a semi-colon" do
+    input = "&nGt"
+    output = [["Character", "&nGt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nGtv without a semi-colon" do
+    input = "&nGtv"
+    output = [["Character", "&nGtv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nLeftarrow without a semi-colon" do
+    input = "&nLeftarrow"
+    output = [["Character", "&nLeftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nLeftrightarrow without a semi-colon" do
+    input = "&nLeftrightarrow"
+    output = [["Character", "&nLeftrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nLl without a semi-colon" do
+    input = "&nLl"
+    output = [["Character", "&nLl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nLt without a semi-colon" do
+    input = "&nLt"
+    output = [["Character", "&nLt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nLtv without a semi-colon" do
+    input = "&nLtv"
+    output = [["Character", "&nLtv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nRightarrow without a semi-colon" do
+    input = "&nRightarrow"
+    output = [["Character", "&nRightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nVDash without a semi-colon" do
+    input = "&nVDash"
+    output = [["Character", "&nVDash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nVdash without a semi-colon" do
+    input = "&nVdash"
+    output = [["Character", "&nVdash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nabla without a semi-colon" do
+    input = "&nabla"
+    output = [["Character", "&nabla"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nacute without a semi-colon" do
+    input = "&nacute"
+    output = [["Character", "&nacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nang without a semi-colon" do
+    input = "&nang"
+    output = [["Character", "&nang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nap without a semi-colon" do
+    input = "&nap"
+    output = [["Character", "&nap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: napE without a semi-colon" do
+    input = "&napE"
+    output = [["Character", "&napE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: napid without a semi-colon" do
+    input = "&napid"
+    output = [["Character", "&napid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: napos without a semi-colon" do
+    input = "&napos"
+    output = [["Character", "&napos"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: napprox without a semi-colon" do
+    input = "&napprox"
+    output = [["Character", "&napprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: natur without a semi-colon" do
+    input = "&natur"
+    output = [["Character", "&natur"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: natural without a semi-colon" do
+    input = "&natural"
+    output = [["Character", "&natural"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: naturals without a semi-colon" do
+    input = "&naturals"
+    output = [["Character", "&naturals"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nbump without a semi-colon" do
+    input = "&nbump"
+    output = [["Character", "&nbump"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nbumpe without a semi-colon" do
+    input = "&nbumpe"
+    output = [["Character", "&nbumpe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ncap without a semi-colon" do
+    input = "&ncap"
+    output = [["Character", "&ncap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ncaron without a semi-colon" do
+    input = "&ncaron"
+    output = [["Character", "&ncaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part14_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part14_test.exs
new file mode 100644
index 00000000..a766a7aa
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part14_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart14Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: ncedil without a semi-colon" do
+    input = "&ncedil"
+    output = [["Character", "&ncedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ncong without a semi-colon" do
+    input = "&ncong"
+    output = [["Character", "&ncong"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ncongdot without a semi-colon" do
+    input = "&ncongdot"
+    output = [["Character", "&ncongdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ncup without a semi-colon" do
+    input = "&ncup"
+    output = [["Character", "&ncup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ncy without a semi-colon" do
+    input = "&ncy"
+    output = [["Character", "&ncy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ndash without a semi-colon" do
+    input = "&ndash"
+    output = [["Character", "&ndash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ne without a semi-colon" do
+    input = "&ne"
+    output = [["Character", "&ne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: neArr without a semi-colon" do
+    input = "&neArr"
+    output = [["Character", "&neArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nearhk without a semi-colon" do
+    input = "&nearhk"
+    output = [["Character", "&nearhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nearr without a semi-colon" do
+    input = "&nearr"
+    output = [["Character", "&nearr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nearrow without a semi-colon" do
+    input = "&nearrow"
+    output = [["Character", "&nearrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nedot without a semi-colon" do
+    input = "&nedot"
+    output = [["Character", "&nedot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nequiv without a semi-colon" do
+    input = "&nequiv"
+    output = [["Character", "&nequiv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nesear without a semi-colon" do
+    input = "&nesear"
+    output = [["Character", "&nesear"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nesim without a semi-colon" do
+    input = "&nesim"
+    output = [["Character", "&nesim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nexist without a semi-colon" do
+    input = "&nexist"
+    output = [["Character", "&nexist"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nexists without a semi-colon" do
+    input = "&nexists"
+    output = [["Character", "&nexists"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nfr without a semi-colon" do
+    input = "&nfr"
+    output = [["Character", "&nfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngE without a semi-colon" do
+    input = "&ngE"
+    output = [["Character", "&ngE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nge without a semi-colon" do
+    input = "&nge"
+    output = [["Character", "&nge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngeq without a semi-colon" do
+    input = "&ngeq"
+    output = [["Character", "&ngeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngeqq without a semi-colon" do
+    input = "&ngeqq"
+    output = [["Character", "&ngeqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngeqslant without a semi-colon" do
+    input = "&ngeqslant"
+    output = [["Character", "&ngeqslant"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nges without a semi-colon" do
+    input = "&nges"
+    output = [["Character", "&nges"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngsim without a semi-colon" do
+    input = "&ngsim"
+    output = [["Character", "&ngsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngt without a semi-colon" do
+    input = "&ngt"
+    output = [["Character", "&ngt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ngtr without a semi-colon" do
+    input = "&ngtr"
+    output = [["Character", "&ngtr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nhArr without a semi-colon" do
+    input = "&nhArr"
+    output = [["Character", "&nhArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nharr without a semi-colon" do
+    input = "&nharr"
+    output = [["Character", "&nharr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nhpar without a semi-colon" do
+    input = "&nhpar"
+    output = [["Character", "&nhpar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ni without a semi-colon" do
+    input = "&ni"
+    output = [["Character", "&ni"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nis without a semi-colon" do
+    input = "&nis"
+    output = [["Character", "&nis"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nisd without a semi-colon" do
+    input = "&nisd"
+    output = [["Character", "&nisd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: niv without a semi-colon" do
+    input = "&niv"
+    output = [["Character", "&niv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: njcy without a semi-colon" do
+    input = "&njcy"
+    output = [["Character", "&njcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nlArr without a semi-colon" do
+    input = "&nlArr"
+    output = [["Character", "&nlArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nlE without a semi-colon" do
+    input = "&nlE"
+    output = [["Character", "&nlE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nlarr without a semi-colon" do
+    input = "&nlarr"
+    output = [["Character", "&nlarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nldr without a semi-colon" do
+    input = "&nldr"
+    output = [["Character", "&nldr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nle without a semi-colon" do
+    input = "&nle"
+    output = [["Character", "&nle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nleftarrow without a semi-colon" do
+    input = "&nleftarrow"
+    output = [["Character", "&nleftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nleftrightarrow without a semi-colon" do
+    input = "&nleftrightarrow"
+    output = [["Character", "&nleftrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nleq without a semi-colon" do
+    input = "&nleq"
+    output = [["Character", "&nleq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nleqq without a semi-colon" do
+    input = "&nleqq"
+    output = [["Character", "&nleqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nleqslant without a semi-colon" do
+    input = "&nleqslant"
+    output = [["Character", "&nleqslant"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nles without a semi-colon" do
+    input = "&nles"
+    output = [["Character", "&nles"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nless without a semi-colon" do
+    input = "&nless"
+    output = [["Character", "&nless"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nlsim without a semi-colon" do
+    input = "&nlsim"
+    output = [["Character", "&nlsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nlt without a semi-colon" do
+    input = "&nlt"
+    output = [["Character", "&nlt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nltri without a semi-colon" do
+    input = "&nltri"
+    output = [["Character", "&nltri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nltrie without a semi-colon" do
+    input = "&nltrie"
+    output = [["Character", "&nltrie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nmid without a semi-colon" do
+    input = "&nmid"
+    output = [["Character", "&nmid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nopf without a semi-colon" do
+    input = "&nopf"
+    output = [["Character", "&nopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: npar without a semi-colon" do
+    input = "&npar"
+    output = [["Character", "&npar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nparallel without a semi-colon" do
+    input = "&nparallel"
+    output = [["Character", "&nparallel"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nparsl without a semi-colon" do
+    input = "&nparsl"
+    output = [["Character", "&nparsl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: npart without a semi-colon" do
+    input = "&npart"
+    output = [["Character", "&npart"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: npolint without a semi-colon" do
+    input = "&npolint"
+    output = [["Character", "&npolint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: npr without a semi-colon" do
+    input = "&npr"
+    output = [["Character", "&npr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nprcue without a semi-colon" do
+    input = "&nprcue"
+    output = [["Character", "&nprcue"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: npre without a semi-colon" do
+    input = "&npre"
+    output = [["Character", "&npre"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nprec without a semi-colon" do
+    input = "&nprec"
+    output = [["Character", "&nprec"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: npreceq without a semi-colon" do
+    input = "&npreceq"
+    output = [["Character", "&npreceq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrArr without a semi-colon" do
+    input = "&nrArr"
+    output = [["Character", "&nrArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrarr without a semi-colon" do
+    input = "&nrarr"
+    output = [["Character", "&nrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrarrc without a semi-colon" do
+    input = "&nrarrc"
+    output = [["Character", "&nrarrc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrarrw without a semi-colon" do
+    input = "&nrarrw"
+    output = [["Character", "&nrarrw"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrightarrow without a semi-colon" do
+    input = "&nrightarrow"
+    output = [["Character", "&nrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrtri without a semi-colon" do
+    input = "&nrtri"
+    output = [["Character", "&nrtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nrtrie without a semi-colon" do
+    input = "&nrtrie"
+    output = [["Character", "&nrtrie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsc without a semi-colon" do
+    input = "&nsc"
+    output = [["Character", "&nsc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsccue without a semi-colon" do
+    input = "&nsccue"
+    output = [["Character", "&nsccue"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsce without a semi-colon" do
+    input = "&nsce"
+    output = [["Character", "&nsce"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nscr without a semi-colon" do
+    input = "&nscr"
+    output = [["Character", "&nscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nshortmid without a semi-colon" do
+    input = "&nshortmid"
+    output = [["Character", "&nshortmid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nshortparallel without a semi-colon" do
+    input = "&nshortparallel"
+    output = [["Character", "&nshortparallel"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsim without a semi-colon" do
+    input = "&nsim"
+    output = [["Character", "&nsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsime without a semi-colon" do
+    input = "&nsime"
+    output = [["Character", "&nsime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsimeq without a semi-colon" do
+    input = "&nsimeq"
+    output = [["Character", "&nsimeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsmid without a semi-colon" do
+    input = "&nsmid"
+    output = [["Character", "&nsmid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nspar without a semi-colon" do
+    input = "&nspar"
+    output = [["Character", "&nspar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsqsube without a semi-colon" do
+    input = "&nsqsube"
+    output = [["Character", "&nsqsube"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsqsupe without a semi-colon" do
+    input = "&nsqsupe"
+    output = [["Character", "&nsqsupe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsub without a semi-colon" do
+    input = "&nsub"
+    output = [["Character", "&nsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsubE without a semi-colon" do
+    input = "&nsubE"
+    output = [["Character", "&nsubE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsube without a semi-colon" do
+    input = "&nsube"
+    output = [["Character", "&nsube"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsubset without a semi-colon" do
+    input = "&nsubset"
+    output = [["Character", "&nsubset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsubseteq without a semi-colon" do
+    input = "&nsubseteq"
+    output = [["Character", "&nsubseteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsubseteqq without a semi-colon" do
+    input = "&nsubseteqq"
+    output = [["Character", "&nsubseteqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsucc without a semi-colon" do
+    input = "&nsucc"
+    output = [["Character", "&nsucc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsucceq without a semi-colon" do
+    input = "&nsucceq"
+    output = [["Character", "&nsucceq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsup without a semi-colon" do
+    input = "&nsup"
+    output = [["Character", "&nsup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsupE without a semi-colon" do
+    input = "&nsupE"
+    output = [["Character", "&nsupE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsupe without a semi-colon" do
+    input = "&nsupe"
+    output = [["Character", "&nsupe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsupset without a semi-colon" do
+    input = "&nsupset"
+    output = [["Character", "&nsupset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsupseteq without a semi-colon" do
+    input = "&nsupseteq"
+    output = [["Character", "&nsupseteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nsupseteqq without a semi-colon" do
+    input = "&nsupseteqq"
+    output = [["Character", "&nsupseteqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ntgl without a semi-colon" do
+    input = "&ntgl"
+    output = [["Character", "&ntgl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ntlg without a semi-colon" do
+    input = "&ntlg"
+    output = [["Character", "&ntlg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ntriangleleft without a semi-colon" do
+    input = "&ntriangleleft"
+    output = [["Character", "&ntriangleleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part15_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part15_test.exs
new file mode 100644
index 00000000..103af700
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part15_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart15Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: ntrianglelefteq without a semi-colon" do
+    input = "&ntrianglelefteq"
+    output = [["Character", "&ntrianglelefteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ntriangleright without a semi-colon" do
+    input = "&ntriangleright"
+    output = [["Character", "&ntriangleright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ntrianglerighteq without a semi-colon" do
+    input = "&ntrianglerighteq"
+    output = [["Character", "&ntrianglerighteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nu without a semi-colon" do
+    input = "&nu"
+    output = [["Character", "&nu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: num without a semi-colon" do
+    input = "&num"
+    output = [["Character", "&num"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: numero without a semi-colon" do
+    input = "&numero"
+    output = [["Character", "&numero"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: numsp without a semi-colon" do
+    input = "&numsp"
+    output = [["Character", "&numsp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvDash without a semi-colon" do
+    input = "&nvDash"
+    output = [["Character", "&nvDash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvHarr without a semi-colon" do
+    input = "&nvHarr"
+    output = [["Character", "&nvHarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvap without a semi-colon" do
+    input = "&nvap"
+    output = [["Character", "&nvap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvdash without a semi-colon" do
+    input = "&nvdash"
+    output = [["Character", "&nvdash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvge without a semi-colon" do
+    input = "&nvge"
+    output = [["Character", "&nvge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvgt without a semi-colon" do
+    input = "&nvgt"
+    output = [["Character", "&nvgt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvinfin without a semi-colon" do
+    input = "&nvinfin"
+    output = [["Character", "&nvinfin"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvlArr without a semi-colon" do
+    input = "&nvlArr"
+    output = [["Character", "&nvlArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvle without a semi-colon" do
+    input = "&nvle"
+    output = [["Character", "&nvle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvlt without a semi-colon" do
+    input = "&nvlt"
+    output = [["Character", "&nvlt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvltrie without a semi-colon" do
+    input = "&nvltrie"
+    output = [["Character", "&nvltrie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvrArr without a semi-colon" do
+    input = "&nvrArr"
+    output = [["Character", "&nvrArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvrtrie without a semi-colon" do
+    input = "&nvrtrie"
+    output = [["Character", "&nvrtrie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nvsim without a semi-colon" do
+    input = "&nvsim"
+    output = [["Character", "&nvsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nwArr without a semi-colon" do
+    input = "&nwArr"
+    output = [["Character", "&nwArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nwarhk without a semi-colon" do
+    input = "&nwarhk"
+    output = [["Character", "&nwarhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nwarr without a semi-colon" do
+    input = "&nwarr"
+    output = [["Character", "&nwarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nwarrow without a semi-colon" do
+    input = "&nwarrow"
+    output = [["Character", "&nwarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: nwnear without a semi-colon" do
+    input = "&nwnear"
+    output = [["Character", "&nwnear"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oS without a semi-colon" do
+    input = "&oS"
+    output = [["Character", "&oS"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oast without a semi-colon" do
+    input = "&oast"
+    output = [["Character", "&oast"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ocir without a semi-colon" do
+    input = "&ocir"
+    output = [["Character", "&ocir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ocy without a semi-colon" do
+    input = "&ocy"
+    output = [["Character", "&ocy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: odash without a semi-colon" do
+    input = "&odash"
+    output = [["Character", "&odash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: odblac without a semi-colon" do
+    input = "&odblac"
+    output = [["Character", "&odblac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: odiv without a semi-colon" do
+    input = "&odiv"
+    output = [["Character", "&odiv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: odot without a semi-colon" do
+    input = "&odot"
+    output = [["Character", "&odot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: odsold without a semi-colon" do
+    input = "&odsold"
+    output = [["Character", "&odsold"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oelig without a semi-colon" do
+    input = "&oelig"
+    output = [["Character", "&oelig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ofcir without a semi-colon" do
+    input = "&ofcir"
+    output = [["Character", "&ofcir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ofr without a semi-colon" do
+    input = "&ofr"
+    output = [["Character", "&ofr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ogon without a semi-colon" do
+    input = "&ogon"
+    output = [["Character", "&ogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ogt without a semi-colon" do
+    input = "&ogt"
+    output = [["Character", "&ogt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ohbar without a semi-colon" do
+    input = "&ohbar"
+    output = [["Character", "&ohbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ohm without a semi-colon" do
+    input = "&ohm"
+    output = [["Character", "&ohm"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oint without a semi-colon" do
+    input = "&oint"
+    output = [["Character", "&oint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: olarr without a semi-colon" do
+    input = "&olarr"
+    output = [["Character", "&olarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: olcir without a semi-colon" do
+    input = "&olcir"
+    output = [["Character", "&olcir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: olcross without a semi-colon" do
+    input = "&olcross"
+    output = [["Character", "&olcross"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oline without a semi-colon" do
+    input = "&oline"
+    output = [["Character", "&oline"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: olt without a semi-colon" do
+    input = "&olt"
+    output = [["Character", "&olt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: omacr without a semi-colon" do
+    input = "&omacr"
+    output = [["Character", "&omacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: omega without a semi-colon" do
+    input = "&omega"
+    output = [["Character", "&omega"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: omicron without a semi-colon" do
+    input = "&omicron"
+    output = [["Character", "&omicron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: omid without a semi-colon" do
+    input = "&omid"
+    output = [["Character", "&omid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ominus without a semi-colon" do
+    input = "&ominus"
+    output = [["Character", "&ominus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oopf without a semi-colon" do
+    input = "&oopf"
+    output = [["Character", "&oopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: opar without a semi-colon" do
+    input = "&opar"
+    output = [["Character", "&opar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: operp without a semi-colon" do
+    input = "&operp"
+    output = [["Character", "&operp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oplus without a semi-colon" do
+    input = "&oplus"
+    output = [["Character", "&oplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: or without a semi-colon" do
+    input = "&or"
+    output = [["Character", "&or"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: orarr without a semi-colon" do
+    input = "&orarr"
+    output = [["Character", "&orarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ord without a semi-colon" do
+    input = "&ord"
+    output = [["Character", "&ord"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: order without a semi-colon" do
+    input = "&order"
+    output = [["Character", "&order"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: orderof without a semi-colon" do
+    input = "&orderof"
+    output = [["Character", "&orderof"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: origof without a semi-colon" do
+    input = "&origof"
+    output = [["Character", "&origof"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oror without a semi-colon" do
+    input = "&oror"
+    output = [["Character", "&oror"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: orslope without a semi-colon" do
+    input = "&orslope"
+    output = [["Character", "&orslope"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: orv without a semi-colon" do
+    input = "&orv"
+    output = [["Character", "&orv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: oscr without a semi-colon" do
+    input = "&oscr"
+    output = [["Character", "&oscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: osol without a semi-colon" do
+    input = "&osol"
+    output = [["Character", "&osol"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: otimes without a semi-colon" do
+    input = "&otimes"
+    output = [["Character", "&otimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: otimesas without a semi-colon" do
+    input = "&otimesas"
+    output = [["Character", "&otimesas"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ovbar without a semi-colon" do
+    input = "&ovbar"
+    output = [["Character", "&ovbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: par without a semi-colon" do
+    input = "&par"
+    output = [["Character", "&par"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: parsim without a semi-colon" do
+    input = "&parsim"
+    output = [["Character", "&parsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: parsl without a semi-colon" do
+    input = "&parsl"
+    output = [["Character", "&parsl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: part without a semi-colon" do
+    input = "&part"
+    output = [["Character", "&part"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pcy without a semi-colon" do
+    input = "&pcy"
+    output = [["Character", "&pcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: percnt without a semi-colon" do
+    input = "&percnt"
+    output = [["Character", "&percnt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: period without a semi-colon" do
+    input = "&period"
+    output = [["Character", "&period"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: permil without a semi-colon" do
+    input = "&permil"
+    output = [["Character", "&permil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: perp without a semi-colon" do
+    input = "&perp"
+    output = [["Character", "&perp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pertenk without a semi-colon" do
+    input = "&pertenk"
+    output = [["Character", "&pertenk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pfr without a semi-colon" do
+    input = "&pfr"
+    output = [["Character", "&pfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: phi without a semi-colon" do
+    input = "&phi"
+    output = [["Character", "&phi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: phiv without a semi-colon" do
+    input = "&phiv"
+    output = [["Character", "&phiv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: phmmat without a semi-colon" do
+    input = "&phmmat"
+    output = [["Character", "&phmmat"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: phone without a semi-colon" do
+    input = "&phone"
+    output = [["Character", "&phone"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pi without a semi-colon" do
+    input = "&pi"
+    output = [["Character", "&pi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pitchfork without a semi-colon" do
+    input = "&pitchfork"
+    output = [["Character", "&pitchfork"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: piv without a semi-colon" do
+    input = "&piv"
+    output = [["Character", "&piv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: planck without a semi-colon" do
+    input = "&planck"
+    output = [["Character", "&planck"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: planckh without a semi-colon" do
+    input = "&planckh"
+    output = [["Character", "&planckh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plankv without a semi-colon" do
+    input = "&plankv"
+    output = [["Character", "&plankv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plus without a semi-colon" do
+    input = "&plus"
+    output = [["Character", "&plus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plusacir without a semi-colon" do
+    input = "&plusacir"
+    output = [["Character", "&plusacir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plusb without a semi-colon" do
+    input = "&plusb"
+    output = [["Character", "&plusb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pluscir without a semi-colon" do
+    input = "&pluscir"
+    output = [["Character", "&pluscir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plusdo without a semi-colon" do
+    input = "&plusdo"
+    output = [["Character", "&plusdo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plusdu without a semi-colon" do
+    input = "&plusdu"
+    output = [["Character", "&plusdu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pluse without a semi-colon" do
+    input = "&pluse"
+    output = [["Character", "&pluse"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: plussim without a semi-colon" do
+    input = "&plussim"
+    output = [["Character", "&plussim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part16_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part16_test.exs
new file mode 100644
index 00000000..33e1de77
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part16_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart16Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: plustwo without a semi-colon" do
+    input = "&plustwo"
+    output = [["Character", "&plustwo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pm without a semi-colon" do
+    input = "&pm"
+    output = [["Character", "&pm"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pointint without a semi-colon" do
+    input = "&pointint"
+    output = [["Character", "&pointint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: popf without a semi-colon" do
+    input = "&popf"
+    output = [["Character", "&popf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pr without a semi-colon" do
+    input = "&pr"
+    output = [["Character", "&pr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prE without a semi-colon" do
+    input = "&prE"
+    output = [["Character", "&prE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prap without a semi-colon" do
+    input = "&prap"
+    output = [["Character", "&prap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prcue without a semi-colon" do
+    input = "&prcue"
+    output = [["Character", "&prcue"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pre without a semi-colon" do
+    input = "&pre"
+    output = [["Character", "&pre"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prec without a semi-colon" do
+    input = "&prec"
+    output = [["Character", "&prec"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: precapprox without a semi-colon" do
+    input = "&precapprox"
+    output = [["Character", "&precapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: preccurlyeq without a semi-colon" do
+    input = "&preccurlyeq"
+    output = [["Character", "&preccurlyeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: preceq without a semi-colon" do
+    input = "&preceq"
+    output = [["Character", "&preceq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: precnapprox without a semi-colon" do
+    input = "&precnapprox"
+    output = [["Character", "&precnapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: precneqq without a semi-colon" do
+    input = "&precneqq"
+    output = [["Character", "&precneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: precnsim without a semi-colon" do
+    input = "&precnsim"
+    output = [["Character", "&precnsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: precsim without a semi-colon" do
+    input = "&precsim"
+    output = [["Character", "&precsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prime without a semi-colon" do
+    input = "&prime"
+    output = [["Character", "&prime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: primes without a semi-colon" do
+    input = "&primes"
+    output = [["Character", "&primes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prnE without a semi-colon" do
+    input = "&prnE"
+    output = [["Character", "&prnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prnap without a semi-colon" do
+    input = "&prnap"
+    output = [["Character", "&prnap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prnsim without a semi-colon" do
+    input = "&prnsim"
+    output = [["Character", "&prnsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prod without a semi-colon" do
+    input = "&prod"
+    output = [["Character", "&prod"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: profalar without a semi-colon" do
+    input = "&profalar"
+    output = [["Character", "&profalar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: profline without a semi-colon" do
+    input = "&profline"
+    output = [["Character", "&profline"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: profsurf without a semi-colon" do
+    input = "&profsurf"
+    output = [["Character", "&profsurf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prop without a semi-colon" do
+    input = "&prop"
+    output = [["Character", "&prop"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: propto without a semi-colon" do
+    input = "&propto"
+    output = [["Character", "&propto"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prsim without a semi-colon" do
+    input = "&prsim"
+    output = [["Character", "&prsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: prurel without a semi-colon" do
+    input = "&prurel"
+    output = [["Character", "&prurel"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: pscr without a semi-colon" do
+    input = "&pscr"
+    output = [["Character", "&pscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: psi without a semi-colon" do
+    input = "&psi"
+    output = [["Character", "&psi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: puncsp without a semi-colon" do
+    input = "&puncsp"
+    output = [["Character", "&puncsp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: qfr without a semi-colon" do
+    input = "&qfr"
+    output = [["Character", "&qfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: qint without a semi-colon" do
+    input = "&qint"
+    output = [["Character", "&qint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: qopf without a semi-colon" do
+    input = "&qopf"
+    output = [["Character", "&qopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: qprime without a semi-colon" do
+    input = "&qprime"
+    output = [["Character", "&qprime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: qscr without a semi-colon" do
+    input = "&qscr"
+    output = [["Character", "&qscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: quaternions without a semi-colon" do
+    input = "&quaternions"
+    output = [["Character", "&quaternions"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: quatint without a semi-colon" do
+    input = "&quatint"
+    output = [["Character", "&quatint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: quest without a semi-colon" do
+    input = "&quest"
+    output = [["Character", "&quest"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: questeq without a semi-colon" do
+    input = "&questeq"
+    output = [["Character", "&questeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rAarr without a semi-colon" do
+    input = "&rAarr"
+    output = [["Character", "&rAarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rArr without a semi-colon" do
+    input = "&rArr"
+    output = [["Character", "&rArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rAtail without a semi-colon" do
+    input = "&rAtail"
+    output = [["Character", "&rAtail"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rBarr without a semi-colon" do
+    input = "&rBarr"
+    output = [["Character", "&rBarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rHar without a semi-colon" do
+    input = "&rHar"
+    output = [["Character", "&rHar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: race without a semi-colon" do
+    input = "&race"
+    output = [["Character", "&race"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: racute without a semi-colon" do
+    input = "&racute"
+    output = [["Character", "&racute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: radic without a semi-colon" do
+    input = "&radic"
+    output = [["Character", "&radic"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: raemptyv without a semi-colon" do
+    input = "&raemptyv"
+    output = [["Character", "&raemptyv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rang without a semi-colon" do
+    input = "&rang"
+    output = [["Character", "&rang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rangd without a semi-colon" do
+    input = "&rangd"
+    output = [["Character", "&rangd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: range without a semi-colon" do
+    input = "&range"
+    output = [["Character", "&range"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rangle without a semi-colon" do
+    input = "&rangle"
+    output = [["Character", "&rangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarr without a semi-colon" do
+    input = "&rarr"
+    output = [["Character", "&rarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrap without a semi-colon" do
+    input = "&rarrap"
+    output = [["Character", "&rarrap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrb without a semi-colon" do
+    input = "&rarrb"
+    output = [["Character", "&rarrb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrbfs without a semi-colon" do
+    input = "&rarrbfs"
+    output = [["Character", "&rarrbfs"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrc without a semi-colon" do
+    input = "&rarrc"
+    output = [["Character", "&rarrc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrfs without a semi-colon" do
+    input = "&rarrfs"
+    output = [["Character", "&rarrfs"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrhk without a semi-colon" do
+    input = "&rarrhk"
+    output = [["Character", "&rarrhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrlp without a semi-colon" do
+    input = "&rarrlp"
+    output = [["Character", "&rarrlp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrpl without a semi-colon" do
+    input = "&rarrpl"
+    output = [["Character", "&rarrpl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrsim without a semi-colon" do
+    input = "&rarrsim"
+    output = [["Character", "&rarrsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrtl without a semi-colon" do
+    input = "&rarrtl"
+    output = [["Character", "&rarrtl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rarrw without a semi-colon" do
+    input = "&rarrw"
+    output = [["Character", "&rarrw"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ratail without a semi-colon" do
+    input = "&ratail"
+    output = [["Character", "&ratail"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ratio without a semi-colon" do
+    input = "&ratio"
+    output = [["Character", "&ratio"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rationals without a semi-colon" do
+    input = "&rationals"
+    output = [["Character", "&rationals"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbarr without a semi-colon" do
+    input = "&rbarr"
+    output = [["Character", "&rbarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbbrk without a semi-colon" do
+    input = "&rbbrk"
+    output = [["Character", "&rbbrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbrace without a semi-colon" do
+    input = "&rbrace"
+    output = [["Character", "&rbrace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbrack without a semi-colon" do
+    input = "&rbrack"
+    output = [["Character", "&rbrack"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbrke without a semi-colon" do
+    input = "&rbrke"
+    output = [["Character", "&rbrke"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbrksld without a semi-colon" do
+    input = "&rbrksld"
+    output = [["Character", "&rbrksld"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rbrkslu without a semi-colon" do
+    input = "&rbrkslu"
+    output = [["Character", "&rbrkslu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rcaron without a semi-colon" do
+    input = "&rcaron"
+    output = [["Character", "&rcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rcedil without a semi-colon" do
+    input = "&rcedil"
+    output = [["Character", "&rcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rceil without a semi-colon" do
+    input = "&rceil"
+    output = [["Character", "&rceil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rcub without a semi-colon" do
+    input = "&rcub"
+    output = [["Character", "&rcub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rcy without a semi-colon" do
+    input = "&rcy"
+    output = [["Character", "&rcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rdca without a semi-colon" do
+    input = "&rdca"
+    output = [["Character", "&rdca"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rdldhar without a semi-colon" do
+    input = "&rdldhar"
+    output = [["Character", "&rdldhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rdquo without a semi-colon" do
+    input = "&rdquo"
+    output = [["Character", "&rdquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rdquor without a semi-colon" do
+    input = "&rdquor"
+    output = [["Character", "&rdquor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rdsh without a semi-colon" do
+    input = "&rdsh"
+    output = [["Character", "&rdsh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: real without a semi-colon" do
+    input = "&real"
+    output = [["Character", "&real"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: realine without a semi-colon" do
+    input = "&realine"
+    output = [["Character", "&realine"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: realpart without a semi-colon" do
+    input = "&realpart"
+    output = [["Character", "&realpart"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: reals without a semi-colon" do
+    input = "&reals"
+    output = [["Character", "&reals"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rect without a semi-colon" do
+    input = "&rect"
+    output = [["Character", "&rect"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rfisht without a semi-colon" do
+    input = "&rfisht"
+    output = [["Character", "&rfisht"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rfloor without a semi-colon" do
+    input = "&rfloor"
+    output = [["Character", "&rfloor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rfr without a semi-colon" do
+    input = "&rfr"
+    output = [["Character", "&rfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rhard without a semi-colon" do
+    input = "&rhard"
+    output = [["Character", "&rhard"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rharu without a semi-colon" do
+    input = "&rharu"
+    output = [["Character", "&rharu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rharul without a semi-colon" do
+    input = "&rharul"
+    output = [["Character", "&rharul"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rho without a semi-colon" do
+    input = "&rho"
+    output = [["Character", "&rho"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rhov without a semi-colon" do
+    input = "&rhov"
+    output = [["Character", "&rhov"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part17_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part17_test.exs
new file mode 100644
index 00000000..cda2ebd6
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part17_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart17Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: rightarrow without a semi-colon" do
+    input = "&rightarrow"
+    output = [["Character", "&rightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightarrowtail without a semi-colon" do
+    input = "&rightarrowtail"
+    output = [["Character", "&rightarrowtail"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightharpoondown without a semi-colon" do
+    input = "&rightharpoondown"
+    output = [["Character", "&rightharpoondown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightharpoonup without a semi-colon" do
+    input = "&rightharpoonup"
+    output = [["Character", "&rightharpoonup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightleftarrows without a semi-colon" do
+    input = "&rightleftarrows"
+    output = [["Character", "&rightleftarrows"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightleftharpoons without a semi-colon" do
+    input = "&rightleftharpoons"
+    output = [["Character", "&rightleftharpoons"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightrightarrows without a semi-colon" do
+    input = "&rightrightarrows"
+    output = [["Character", "&rightrightarrows"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightsquigarrow without a semi-colon" do
+    input = "&rightsquigarrow"
+    output = [["Character", "&rightsquigarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rightthreetimes without a semi-colon" do
+    input = "&rightthreetimes"
+    output = [["Character", "&rightthreetimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ring without a semi-colon" do
+    input = "&ring"
+    output = [["Character", "&ring"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: risingdotseq without a semi-colon" do
+    input = "&risingdotseq"
+    output = [["Character", "&risingdotseq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rlarr without a semi-colon" do
+    input = "&rlarr"
+    output = [["Character", "&rlarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rlhar without a semi-colon" do
+    input = "&rlhar"
+    output = [["Character", "&rlhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rlm without a semi-colon" do
+    input = "&rlm"
+    output = [["Character", "&rlm"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rmoust without a semi-colon" do
+    input = "&rmoust"
+    output = [["Character", "&rmoust"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rmoustache without a semi-colon" do
+    input = "&rmoustache"
+    output = [["Character", "&rmoustache"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rnmid without a semi-colon" do
+    input = "&rnmid"
+    output = [["Character", "&rnmid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: roang without a semi-colon" do
+    input = "&roang"
+    output = [["Character", "&roang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: roarr without a semi-colon" do
+    input = "&roarr"
+    output = [["Character", "&roarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: robrk without a semi-colon" do
+    input = "&robrk"
+    output = [["Character", "&robrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ropar without a semi-colon" do
+    input = "&ropar"
+    output = [["Character", "&ropar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ropf without a semi-colon" do
+    input = "&ropf"
+    output = [["Character", "&ropf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: roplus without a semi-colon" do
+    input = "&roplus"
+    output = [["Character", "&roplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rotimes without a semi-colon" do
+    input = "&rotimes"
+    output = [["Character", "&rotimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rpar without a semi-colon" do
+    input = "&rpar"
+    output = [["Character", "&rpar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rpargt without a semi-colon" do
+    input = "&rpargt"
+    output = [["Character", "&rpargt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rppolint without a semi-colon" do
+    input = "&rppolint"
+    output = [["Character", "&rppolint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rrarr without a semi-colon" do
+    input = "&rrarr"
+    output = [["Character", "&rrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rsaquo without a semi-colon" do
+    input = "&rsaquo"
+    output = [["Character", "&rsaquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rscr without a semi-colon" do
+    input = "&rscr"
+    output = [["Character", "&rscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rsh without a semi-colon" do
+    input = "&rsh"
+    output = [["Character", "&rsh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rsqb without a semi-colon" do
+    input = "&rsqb"
+    output = [["Character", "&rsqb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rsquo without a semi-colon" do
+    input = "&rsquo"
+    output = [["Character", "&rsquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rsquor without a semi-colon" do
+    input = "&rsquor"
+    output = [["Character", "&rsquor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rthree without a semi-colon" do
+    input = "&rthree"
+    output = [["Character", "&rthree"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rtimes without a semi-colon" do
+    input = "&rtimes"
+    output = [["Character", "&rtimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rtri without a semi-colon" do
+    input = "&rtri"
+    output = [["Character", "&rtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rtrie without a semi-colon" do
+    input = "&rtrie"
+    output = [["Character", "&rtrie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rtrif without a semi-colon" do
+    input = "&rtrif"
+    output = [["Character", "&rtrif"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rtriltri without a semi-colon" do
+    input = "&rtriltri"
+    output = [["Character", "&rtriltri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ruluhar without a semi-colon" do
+    input = "&ruluhar"
+    output = [["Character", "&ruluhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: rx without a semi-colon" do
+    input = "&rx"
+    output = [["Character", "&rx"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sacute without a semi-colon" do
+    input = "&sacute"
+    output = [["Character", "&sacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sbquo without a semi-colon" do
+    input = "&sbquo"
+    output = [["Character", "&sbquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sc without a semi-colon" do
+    input = "&sc"
+    output = [["Character", "&sc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scE without a semi-colon" do
+    input = "&scE"
+    output = [["Character", "&scE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scap without a semi-colon" do
+    input = "&scap"
+    output = [["Character", "&scap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scaron without a semi-colon" do
+    input = "&scaron"
+    output = [["Character", "&scaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sccue without a semi-colon" do
+    input = "&sccue"
+    output = [["Character", "&sccue"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sce without a semi-colon" do
+    input = "&sce"
+    output = [["Character", "&sce"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scedil without a semi-colon" do
+    input = "&scedil"
+    output = [["Character", "&scedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scirc without a semi-colon" do
+    input = "&scirc"
+    output = [["Character", "&scirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scnE without a semi-colon" do
+    input = "&scnE"
+    output = [["Character", "&scnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scnap without a semi-colon" do
+    input = "&scnap"
+    output = [["Character", "&scnap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scnsim without a semi-colon" do
+    input = "&scnsim"
+    output = [["Character", "&scnsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scpolint without a semi-colon" do
+    input = "&scpolint"
+    output = [["Character", "&scpolint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scsim without a semi-colon" do
+    input = "&scsim"
+    output = [["Character", "&scsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: scy without a semi-colon" do
+    input = "&scy"
+    output = [["Character", "&scy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sdot without a semi-colon" do
+    input = "&sdot"
+    output = [["Character", "&sdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sdotb without a semi-colon" do
+    input = "&sdotb"
+    output = [["Character", "&sdotb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sdote without a semi-colon" do
+    input = "&sdote"
+    output = [["Character", "&sdote"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: seArr without a semi-colon" do
+    input = "&seArr"
+    output = [["Character", "&seArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: searhk without a semi-colon" do
+    input = "&searhk"
+    output = [["Character", "&searhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: searr without a semi-colon" do
+    input = "&searr"
+    output = [["Character", "&searr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: searrow without a semi-colon" do
+    input = "&searrow"
+    output = [["Character", "&searrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: semi without a semi-colon" do
+    input = "&semi"
+    output = [["Character", "&semi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: seswar without a semi-colon" do
+    input = "&seswar"
+    output = [["Character", "&seswar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: setminus without a semi-colon" do
+    input = "&setminus"
+    output = [["Character", "&setminus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: setmn without a semi-colon" do
+    input = "&setmn"
+    output = [["Character", "&setmn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sext without a semi-colon" do
+    input = "&sext"
+    output = [["Character", "&sext"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sfr without a semi-colon" do
+    input = "&sfr"
+    output = [["Character", "&sfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sfrown without a semi-colon" do
+    input = "&sfrown"
+    output = [["Character", "&sfrown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sharp without a semi-colon" do
+    input = "&sharp"
+    output = [["Character", "&sharp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: shchcy without a semi-colon" do
+    input = "&shchcy"
+    output = [["Character", "&shchcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: shcy without a semi-colon" do
+    input = "&shcy"
+    output = [["Character", "&shcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: shortmid without a semi-colon" do
+    input = "&shortmid"
+    output = [["Character", "&shortmid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: shortparallel without a semi-colon" do
+    input = "&shortparallel"
+    output = [["Character", "&shortparallel"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sigma without a semi-colon" do
+    input = "&sigma"
+    output = [["Character", "&sigma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sigmaf without a semi-colon" do
+    input = "&sigmaf"
+    output = [["Character", "&sigmaf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sigmav without a semi-colon" do
+    input = "&sigmav"
+    output = [["Character", "&sigmav"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sim without a semi-colon" do
+    input = "&sim"
+    output = [["Character", "&sim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simdot without a semi-colon" do
+    input = "&simdot"
+    output = [["Character", "&simdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sime without a semi-colon" do
+    input = "&sime"
+    output = [["Character", "&sime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simeq without a semi-colon" do
+    input = "&simeq"
+    output = [["Character", "&simeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simg without a semi-colon" do
+    input = "&simg"
+    output = [["Character", "&simg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simgE without a semi-colon" do
+    input = "&simgE"
+    output = [["Character", "&simgE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: siml without a semi-colon" do
+    input = "&siml"
+    output = [["Character", "&siml"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simlE without a semi-colon" do
+    input = "&simlE"
+    output = [["Character", "&simlE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simne without a semi-colon" do
+    input = "&simne"
+    output = [["Character", "&simne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simplus without a semi-colon" do
+    input = "&simplus"
+    output = [["Character", "&simplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: simrarr without a semi-colon" do
+    input = "&simrarr"
+    output = [["Character", "&simrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: slarr without a semi-colon" do
+    input = "&slarr"
+    output = [["Character", "&slarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smallsetminus without a semi-colon" do
+    input = "&smallsetminus"
+    output = [["Character", "&smallsetminus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smashp without a semi-colon" do
+    input = "&smashp"
+    output = [["Character", "&smashp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smeparsl without a semi-colon" do
+    input = "&smeparsl"
+    output = [["Character", "&smeparsl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smid without a semi-colon" do
+    input = "&smid"
+    output = [["Character", "&smid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smile without a semi-colon" do
+    input = "&smile"
+    output = [["Character", "&smile"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smt without a semi-colon" do
+    input = "&smt"
+    output = [["Character", "&smt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smte without a semi-colon" do
+    input = "&smte"
+    output = [["Character", "&smte"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: smtes without a semi-colon" do
+    input = "&smtes"
+    output = [["Character", "&smtes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part18_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part18_test.exs
new file mode 100644
index 00000000..541e67ea
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part18_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart18Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: softcy without a semi-colon" do
+    input = "&softcy"
+    output = [["Character", "&softcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sol without a semi-colon" do
+    input = "&sol"
+    output = [["Character", "&sol"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: solb without a semi-colon" do
+    input = "&solb"
+    output = [["Character", "&solb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: solbar without a semi-colon" do
+    input = "&solbar"
+    output = [["Character", "&solbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sopf without a semi-colon" do
+    input = "&sopf"
+    output = [["Character", "&sopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: spades without a semi-colon" do
+    input = "&spades"
+    output = [["Character", "&spades"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: spadesuit without a semi-colon" do
+    input = "&spadesuit"
+    output = [["Character", "&spadesuit"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: spar without a semi-colon" do
+    input = "&spar"
+    output = [["Character", "&spar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqcap without a semi-colon" do
+    input = "&sqcap"
+    output = [["Character", "&sqcap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqcaps without a semi-colon" do
+    input = "&sqcaps"
+    output = [["Character", "&sqcaps"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqcup without a semi-colon" do
+    input = "&sqcup"
+    output = [["Character", "&sqcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqcups without a semi-colon" do
+    input = "&sqcups"
+    output = [["Character", "&sqcups"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsub without a semi-colon" do
+    input = "&sqsub"
+    output = [["Character", "&sqsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsube without a semi-colon" do
+    input = "&sqsube"
+    output = [["Character", "&sqsube"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsubset without a semi-colon" do
+    input = "&sqsubset"
+    output = [["Character", "&sqsubset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsubseteq without a semi-colon" do
+    input = "&sqsubseteq"
+    output = [["Character", "&sqsubseteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsup without a semi-colon" do
+    input = "&sqsup"
+    output = [["Character", "&sqsup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsupe without a semi-colon" do
+    input = "&sqsupe"
+    output = [["Character", "&sqsupe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsupset without a semi-colon" do
+    input = "&sqsupset"
+    output = [["Character", "&sqsupset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sqsupseteq without a semi-colon" do
+    input = "&sqsupseteq"
+    output = [["Character", "&sqsupseteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: squ without a semi-colon" do
+    input = "&squ"
+    output = [["Character", "&squ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: square without a semi-colon" do
+    input = "&square"
+    output = [["Character", "&square"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: squarf without a semi-colon" do
+    input = "&squarf"
+    output = [["Character", "&squarf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: squf without a semi-colon" do
+    input = "&squf"
+    output = [["Character", "&squf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: srarr without a semi-colon" do
+    input = "&srarr"
+    output = [["Character", "&srarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sscr without a semi-colon" do
+    input = "&sscr"
+    output = [["Character", "&sscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ssetmn without a semi-colon" do
+    input = "&ssetmn"
+    output = [["Character", "&ssetmn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ssmile without a semi-colon" do
+    input = "&ssmile"
+    output = [["Character", "&ssmile"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sstarf without a semi-colon" do
+    input = "&sstarf"
+    output = [["Character", "&sstarf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: star without a semi-colon" do
+    input = "&star"
+    output = [["Character", "&star"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: starf without a semi-colon" do
+    input = "&starf"
+    output = [["Character", "&starf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: straightepsilon without a semi-colon" do
+    input = "&straightepsilon"
+    output = [["Character", "&straightepsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: straightphi without a semi-colon" do
+    input = "&straightphi"
+    output = [["Character", "&straightphi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: strns without a semi-colon" do
+    input = "&strns"
+    output = [["Character", "&strns"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sub without a semi-colon" do
+    input = "&sub"
+    output = [["Character", "&sub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subE without a semi-colon" do
+    input = "&subE"
+    output = [["Character", "&subE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subdot without a semi-colon" do
+    input = "&subdot"
+    output = [["Character", "&subdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sube without a semi-colon" do
+    input = "&sube"
+    output = [["Character", "&sube"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subedot without a semi-colon" do
+    input = "&subedot"
+    output = [["Character", "&subedot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: submult without a semi-colon" do
+    input = "&submult"
+    output = [["Character", "&submult"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subnE without a semi-colon" do
+    input = "&subnE"
+    output = [["Character", "&subnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subne without a semi-colon" do
+    input = "&subne"
+    output = [["Character", "&subne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subplus without a semi-colon" do
+    input = "&subplus"
+    output = [["Character", "&subplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subrarr without a semi-colon" do
+    input = "&subrarr"
+    output = [["Character", "&subrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subset without a semi-colon" do
+    input = "&subset"
+    output = [["Character", "&subset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subseteq without a semi-colon" do
+    input = "&subseteq"
+    output = [["Character", "&subseteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subseteqq without a semi-colon" do
+    input = "&subseteqq"
+    output = [["Character", "&subseteqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subsetneq without a semi-colon" do
+    input = "&subsetneq"
+    output = [["Character", "&subsetneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subsetneqq without a semi-colon" do
+    input = "&subsetneqq"
+    output = [["Character", "&subsetneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subsim without a semi-colon" do
+    input = "&subsim"
+    output = [["Character", "&subsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subsub without a semi-colon" do
+    input = "&subsub"
+    output = [["Character", "&subsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: subsup without a semi-colon" do
+    input = "&subsup"
+    output = [["Character", "&subsup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succ without a semi-colon" do
+    input = "&succ"
+    output = [["Character", "&succ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succapprox without a semi-colon" do
+    input = "&succapprox"
+    output = [["Character", "&succapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succcurlyeq without a semi-colon" do
+    input = "&succcurlyeq"
+    output = [["Character", "&succcurlyeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succeq without a semi-colon" do
+    input = "&succeq"
+    output = [["Character", "&succeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succnapprox without a semi-colon" do
+    input = "&succnapprox"
+    output = [["Character", "&succnapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succneqq without a semi-colon" do
+    input = "&succneqq"
+    output = [["Character", "&succneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succnsim without a semi-colon" do
+    input = "&succnsim"
+    output = [["Character", "&succnsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: succsim without a semi-colon" do
+    input = "&succsim"
+    output = [["Character", "&succsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sum without a semi-colon" do
+    input = "&sum"
+    output = [["Character", "&sum"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sung without a semi-colon" do
+    input = "&sung"
+    output = [["Character", "&sung"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: sup without a semi-colon" do
+    input = "&sup"
+    output = [["Character", "&sup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supE without a semi-colon" do
+    input = "&supE"
+    output = [["Character", "&supE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supdot without a semi-colon" do
+    input = "&supdot"
+    output = [["Character", "&supdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supdsub without a semi-colon" do
+    input = "&supdsub"
+    output = [["Character", "&supdsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supe without a semi-colon" do
+    input = "&supe"
+    output = [["Character", "&supe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supedot without a semi-colon" do
+    input = "&supedot"
+    output = [["Character", "&supedot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: suphsol without a semi-colon" do
+    input = "&suphsol"
+    output = [["Character", "&suphsol"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: suphsub without a semi-colon" do
+    input = "&suphsub"
+    output = [["Character", "&suphsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: suplarr without a semi-colon" do
+    input = "&suplarr"
+    output = [["Character", "&suplarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supmult without a semi-colon" do
+    input = "&supmult"
+    output = [["Character", "&supmult"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supnE without a semi-colon" do
+    input = "&supnE"
+    output = [["Character", "&supnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supne without a semi-colon" do
+    input = "&supne"
+    output = [["Character", "&supne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supplus without a semi-colon" do
+    input = "&supplus"
+    output = [["Character", "&supplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supset without a semi-colon" do
+    input = "&supset"
+    output = [["Character", "&supset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supseteq without a semi-colon" do
+    input = "&supseteq"
+    output = [["Character", "&supseteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supseteqq without a semi-colon" do
+    input = "&supseteqq"
+    output = [["Character", "&supseteqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supsetneq without a semi-colon" do
+    input = "&supsetneq"
+    output = [["Character", "&supsetneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supsetneqq without a semi-colon" do
+    input = "&supsetneqq"
+    output = [["Character", "&supsetneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supsim without a semi-colon" do
+    input = "&supsim"
+    output = [["Character", "&supsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supsub without a semi-colon" do
+    input = "&supsub"
+    output = [["Character", "&supsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: supsup without a semi-colon" do
+    input = "&supsup"
+    output = [["Character", "&supsup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: swArr without a semi-colon" do
+    input = "&swArr"
+    output = [["Character", "&swArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: swarhk without a semi-colon" do
+    input = "&swarhk"
+    output = [["Character", "&swarhk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: swarr without a semi-colon" do
+    input = "&swarr"
+    output = [["Character", "&swarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: swarrow without a semi-colon" do
+    input = "&swarrow"
+    output = [["Character", "&swarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: swnwar without a semi-colon" do
+    input = "&swnwar"
+    output = [["Character", "&swnwar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: target without a semi-colon" do
+    input = "&target"
+    output = [["Character", "&target"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tau without a semi-colon" do
+    input = "&tau"
+    output = [["Character", "&tau"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tbrk without a semi-colon" do
+    input = "&tbrk"
+    output = [["Character", "&tbrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tcaron without a semi-colon" do
+    input = "&tcaron"
+    output = [["Character", "&tcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tcedil without a semi-colon" do
+    input = "&tcedil"
+    output = [["Character", "&tcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tcy without a semi-colon" do
+    input = "&tcy"
+    output = [["Character", "&tcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tdot without a semi-colon" do
+    input = "&tdot"
+    output = [["Character", "&tdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: telrec without a semi-colon" do
+    input = "&telrec"
+    output = [["Character", "&telrec"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tfr without a semi-colon" do
+    input = "&tfr"
+    output = [["Character", "&tfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: there4 without a semi-colon" do
+    input = "&there4"
+    output = [["Character", "&there4"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: therefore without a semi-colon" do
+    input = "&therefore"
+    output = [["Character", "&therefore"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: theta without a semi-colon" do
+    input = "&theta"
+    output = [["Character", "&theta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part19_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part19_test.exs
new file mode 100644
index 00000000..31a4a9d9
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part19_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart19Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: thetasym without a semi-colon" do
+    input = "&thetasym"
+    output = [["Character", "&thetasym"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: thetav without a semi-colon" do
+    input = "&thetav"
+    output = [["Character", "&thetav"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: thickapprox without a semi-colon" do
+    input = "&thickapprox"
+    output = [["Character", "&thickapprox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: thicksim without a semi-colon" do
+    input = "&thicksim"
+    output = [["Character", "&thicksim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: thinsp without a semi-colon" do
+    input = "&thinsp"
+    output = [["Character", "&thinsp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: thkap without a semi-colon" do
+    input = "&thkap"
+    output = [["Character", "&thkap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: thksim without a semi-colon" do
+    input = "&thksim"
+    output = [["Character", "&thksim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tilde without a semi-colon" do
+    input = "&tilde"
+    output = [["Character", "&tilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tint without a semi-colon" do
+    input = "&tint"
+    output = [["Character", "&tint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: toea without a semi-colon" do
+    input = "&toea"
+    output = [["Character", "&toea"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: top without a semi-colon" do
+    input = "&top"
+    output = [["Character", "&top"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: topbot without a semi-colon" do
+    input = "&topbot"
+    output = [["Character", "&topbot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: topcir without a semi-colon" do
+    input = "&topcir"
+    output = [["Character", "&topcir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: topf without a semi-colon" do
+    input = "&topf"
+    output = [["Character", "&topf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: topfork without a semi-colon" do
+    input = "&topfork"
+    output = [["Character", "&topfork"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tosa without a semi-colon" do
+    input = "&tosa"
+    output = [["Character", "&tosa"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tprime without a semi-colon" do
+    input = "&tprime"
+    output = [["Character", "&tprime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: trade without a semi-colon" do
+    input = "&trade"
+    output = [["Character", "&trade"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triangle without a semi-colon" do
+    input = "&triangle"
+    output = [["Character", "&triangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triangledown without a semi-colon" do
+    input = "&triangledown"
+    output = [["Character", "&triangledown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triangleleft without a semi-colon" do
+    input = "&triangleleft"
+    output = [["Character", "&triangleleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: trianglelefteq without a semi-colon" do
+    input = "&trianglelefteq"
+    output = [["Character", "&trianglelefteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triangleq without a semi-colon" do
+    input = "&triangleq"
+    output = [["Character", "&triangleq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triangleright without a semi-colon" do
+    input = "&triangleright"
+    output = [["Character", "&triangleright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: trianglerighteq without a semi-colon" do
+    input = "&trianglerighteq"
+    output = [["Character", "&trianglerighteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tridot without a semi-colon" do
+    input = "&tridot"
+    output = [["Character", "&tridot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: trie without a semi-colon" do
+    input = "&trie"
+    output = [["Character", "&trie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triminus without a semi-colon" do
+    input = "&triminus"
+    output = [["Character", "&triminus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: triplus without a semi-colon" do
+    input = "&triplus"
+    output = [["Character", "&triplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: trisb without a semi-colon" do
+    input = "&trisb"
+    output = [["Character", "&trisb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tritime without a semi-colon" do
+    input = "&tritime"
+    output = [["Character", "&tritime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: trpezium without a semi-colon" do
+    input = "&trpezium"
+    output = [["Character", "&trpezium"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tscr without a semi-colon" do
+    input = "&tscr"
+    output = [["Character", "&tscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tscy without a semi-colon" do
+    input = "&tscy"
+    output = [["Character", "&tscy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tshcy without a semi-colon" do
+    input = "&tshcy"
+    output = [["Character", "&tshcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: tstrok without a semi-colon" do
+    input = "&tstrok"
+    output = [["Character", "&tstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: twixt without a semi-colon" do
+    input = "&twixt"
+    output = [["Character", "&twixt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: twoheadleftarrow without a semi-colon" do
+    input = "&twoheadleftarrow"
+    output = [["Character", "&twoheadleftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: twoheadrightarrow without a semi-colon" do
+    input = "&twoheadrightarrow"
+    output = [["Character", "&twoheadrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uArr without a semi-colon" do
+    input = "&uArr"
+    output = [["Character", "&uArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uHar without a semi-colon" do
+    input = "&uHar"
+    output = [["Character", "&uHar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uarr without a semi-colon" do
+    input = "&uarr"
+    output = [["Character", "&uarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ubrcy without a semi-colon" do
+    input = "&ubrcy"
+    output = [["Character", "&ubrcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ubreve without a semi-colon" do
+    input = "&ubreve"
+    output = [["Character", "&ubreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ucy without a semi-colon" do
+    input = "&ucy"
+    output = [["Character", "&ucy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: udarr without a semi-colon" do
+    input = "&udarr"
+    output = [["Character", "&udarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: udblac without a semi-colon" do
+    input = "&udblac"
+    output = [["Character", "&udblac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: udhar without a semi-colon" do
+    input = "&udhar"
+    output = [["Character", "&udhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ufisht without a semi-colon" do
+    input = "&ufisht"
+    output = [["Character", "&ufisht"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ufr without a semi-colon" do
+    input = "&ufr"
+    output = [["Character", "&ufr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uharl without a semi-colon" do
+    input = "&uharl"
+    output = [["Character", "&uharl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uharr without a semi-colon" do
+    input = "&uharr"
+    output = [["Character", "&uharr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uhblk without a semi-colon" do
+    input = "&uhblk"
+    output = [["Character", "&uhblk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ulcorn without a semi-colon" do
+    input = "&ulcorn"
+    output = [["Character", "&ulcorn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ulcorner without a semi-colon" do
+    input = "&ulcorner"
+    output = [["Character", "&ulcorner"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ulcrop without a semi-colon" do
+    input = "&ulcrop"
+    output = [["Character", "&ulcrop"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ultri without a semi-colon" do
+    input = "&ultri"
+    output = [["Character", "&ultri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: umacr without a semi-colon" do
+    input = "&umacr"
+    output = [["Character", "&umacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uogon without a semi-colon" do
+    input = "&uogon"
+    output = [["Character", "&uogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uopf without a semi-colon" do
+    input = "&uopf"
+    output = [["Character", "&uopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uparrow without a semi-colon" do
+    input = "&uparrow"
+    output = [["Character", "&uparrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: updownarrow without a semi-colon" do
+    input = "&updownarrow"
+    output = [["Character", "&updownarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: upharpoonleft without a semi-colon" do
+    input = "&upharpoonleft"
+    output = [["Character", "&upharpoonleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: upharpoonright without a semi-colon" do
+    input = "&upharpoonright"
+    output = [["Character", "&upharpoonright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uplus without a semi-colon" do
+    input = "&uplus"
+    output = [["Character", "&uplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: upsi without a semi-colon" do
+    input = "&upsi"
+    output = [["Character", "&upsi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: upsih without a semi-colon" do
+    input = "&upsih"
+    output = [["Character", "&upsih"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: upsilon without a semi-colon" do
+    input = "&upsilon"
+    output = [["Character", "&upsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: upuparrows without a semi-colon" do
+    input = "&upuparrows"
+    output = [["Character", "&upuparrows"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: urcorn without a semi-colon" do
+    input = "&urcorn"
+    output = [["Character", "&urcorn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: urcorner without a semi-colon" do
+    input = "&urcorner"
+    output = [["Character", "&urcorner"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: urcrop without a semi-colon" do
+    input = "&urcrop"
+    output = [["Character", "&urcrop"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uring without a semi-colon" do
+    input = "&uring"
+    output = [["Character", "&uring"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: urtri without a semi-colon" do
+    input = "&urtri"
+    output = [["Character", "&urtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uscr without a semi-colon" do
+    input = "&uscr"
+    output = [["Character", "&uscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: utdot without a semi-colon" do
+    input = "&utdot"
+    output = [["Character", "&utdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: utilde without a semi-colon" do
+    input = "&utilde"
+    output = [["Character", "&utilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: utri without a semi-colon" do
+    input = "&utri"
+    output = [["Character", "&utri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: utrif without a semi-colon" do
+    input = "&utrif"
+    output = [["Character", "&utrif"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uuarr without a semi-colon" do
+    input = "&uuarr"
+    output = [["Character", "&uuarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: uwangle without a semi-colon" do
+    input = "&uwangle"
+    output = [["Character", "&uwangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vArr without a semi-colon" do
+    input = "&vArr"
+    output = [["Character", "&vArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vBar without a semi-colon" do
+    input = "&vBar"
+    output = [["Character", "&vBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vBarv without a semi-colon" do
+    input = "&vBarv"
+    output = [["Character", "&vBarv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vDash without a semi-colon" do
+    input = "&vDash"
+    output = [["Character", "&vDash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vangrt without a semi-colon" do
+    input = "&vangrt"
+    output = [["Character", "&vangrt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varepsilon without a semi-colon" do
+    input = "&varepsilon"
+    output = [["Character", "&varepsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varkappa without a semi-colon" do
+    input = "&varkappa"
+    output = [["Character", "&varkappa"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varnothing without a semi-colon" do
+    input = "&varnothing"
+    output = [["Character", "&varnothing"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varphi without a semi-colon" do
+    input = "&varphi"
+    output = [["Character", "&varphi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varpi without a semi-colon" do
+    input = "&varpi"
+    output = [["Character", "&varpi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varpropto without a semi-colon" do
+    input = "&varpropto"
+    output = [["Character", "&varpropto"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varr without a semi-colon" do
+    input = "&varr"
+    output = [["Character", "&varr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varrho without a semi-colon" do
+    input = "&varrho"
+    output = [["Character", "&varrho"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varsigma without a semi-colon" do
+    input = "&varsigma"
+    output = [["Character", "&varsigma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varsubsetneq without a semi-colon" do
+    input = "&varsubsetneq"
+    output = [["Character", "&varsubsetneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varsubsetneqq without a semi-colon" do
+    input = "&varsubsetneqq"
+    output = [["Character", "&varsubsetneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varsupsetneq without a semi-colon" do
+    input = "&varsupsetneq"
+    output = [["Character", "&varsupsetneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: varsupsetneqq without a semi-colon" do
+    input = "&varsupsetneqq"
+    output = [["Character", "&varsupsetneqq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vartheta without a semi-colon" do
+    input = "&vartheta"
+    output = [["Character", "&vartheta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part1_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part1_test.exs
new file mode 100644
index 00000000..feba9cc9
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part1_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart1Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: Abreve without a semi-colon" do
+    input = "&Abreve"
+    output = [["Character", "&Abreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Acy without a semi-colon" do
+    input = "&Acy"
+    output = [["Character", "&Acy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Afr without a semi-colon" do
+    input = "&Afr"
+    output = [["Character", "&Afr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Alpha without a semi-colon" do
+    input = "&Alpha"
+    output = [["Character", "&Alpha"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Amacr without a semi-colon" do
+    input = "&Amacr"
+    output = [["Character", "&Amacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: And without a semi-colon" do
+    input = "&And"
+    output = [["Character", "&And"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Aogon without a semi-colon" do
+    input = "&Aogon"
+    output = [["Character", "&Aogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Aopf without a semi-colon" do
+    input = "&Aopf"
+    output = [["Character", "&Aopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ApplyFunction without a semi-colon" do
+    input = "&ApplyFunction"
+    output = [["Character", "&ApplyFunction"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ascr without a semi-colon" do
+    input = "&Ascr"
+    output = [["Character", "&Ascr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Assign without a semi-colon" do
+    input = "&Assign"
+    output = [["Character", "&Assign"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Backslash without a semi-colon" do
+    input = "&Backslash"
+    output = [["Character", "&Backslash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Barv without a semi-colon" do
+    input = "&Barv"
+    output = [["Character", "&Barv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Barwed without a semi-colon" do
+    input = "&Barwed"
+    output = [["Character", "&Barwed"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Bcy without a semi-colon" do
+    input = "&Bcy"
+    output = [["Character", "&Bcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Because without a semi-colon" do
+    input = "&Because"
+    output = [["Character", "&Because"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Bernoullis without a semi-colon" do
+    input = "&Bernoullis"
+    output = [["Character", "&Bernoullis"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Beta without a semi-colon" do
+    input = "&Beta"
+    output = [["Character", "&Beta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Bfr without a semi-colon" do
+    input = "&Bfr"
+    output = [["Character", "&Bfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Bopf without a semi-colon" do
+    input = "&Bopf"
+    output = [["Character", "&Bopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Breve without a semi-colon" do
+    input = "&Breve"
+    output = [["Character", "&Breve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Bscr without a semi-colon" do
+    input = "&Bscr"
+    output = [["Character", "&Bscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Bumpeq without a semi-colon" do
+    input = "&Bumpeq"
+    output = [["Character", "&Bumpeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CHcy without a semi-colon" do
+    input = "&CHcy"
+    output = [["Character", "&CHcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cacute without a semi-colon" do
+    input = "&Cacute"
+    output = [["Character", "&Cacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cap without a semi-colon" do
+    input = "&Cap"
+    output = [["Character", "&Cap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CapitalDifferentialD without a semi-colon" do
+    input = "&CapitalDifferentialD"
+    output = [["Character", "&CapitalDifferentialD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cayleys without a semi-colon" do
+    input = "&Cayleys"
+    output = [["Character", "&Cayleys"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ccaron without a semi-colon" do
+    input = "&Ccaron"
+    output = [["Character", "&Ccaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ccirc without a semi-colon" do
+    input = "&Ccirc"
+    output = [["Character", "&Ccirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cconint without a semi-colon" do
+    input = "&Cconint"
+    output = [["Character", "&Cconint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cdot without a semi-colon" do
+    input = "&Cdot"
+    output = [["Character", "&Cdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cedilla without a semi-colon" do
+    input = "&Cedilla"
+    output = [["Character", "&Cedilla"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CenterDot without a semi-colon" do
+    input = "&CenterDot"
+    output = [["Character", "&CenterDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cfr without a semi-colon" do
+    input = "&Cfr"
+    output = [["Character", "&Cfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Chi without a semi-colon" do
+    input = "&Chi"
+    output = [["Character", "&Chi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CircleDot without a semi-colon" do
+    input = "&CircleDot"
+    output = [["Character", "&CircleDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CircleMinus without a semi-colon" do
+    input = "&CircleMinus"
+    output = [["Character", "&CircleMinus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CirclePlus without a semi-colon" do
+    input = "&CirclePlus"
+    output = [["Character", "&CirclePlus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CircleTimes without a semi-colon" do
+    input = "&CircleTimes"
+    output = [["Character", "&CircleTimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ClockwiseContourIntegral without a semi-colon" do
+    input = "&ClockwiseContourIntegral"
+    output = [["Character", "&ClockwiseContourIntegral"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CloseCurlyDoubleQuote without a semi-colon" do
+    input = "&CloseCurlyDoubleQuote"
+    output = [["Character", "&CloseCurlyDoubleQuote"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CloseCurlyQuote without a semi-colon" do
+    input = "&CloseCurlyQuote"
+    output = [["Character", "&CloseCurlyQuote"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Colon without a semi-colon" do
+    input = "&Colon"
+    output = [["Character", "&Colon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Colone without a semi-colon" do
+    input = "&Colone"
+    output = [["Character", "&Colone"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Congruent without a semi-colon" do
+    input = "&Congruent"
+    output = [["Character", "&Congruent"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Conint without a semi-colon" do
+    input = "&Conint"
+    output = [["Character", "&Conint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ContourIntegral without a semi-colon" do
+    input = "&ContourIntegral"
+    output = [["Character", "&ContourIntegral"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Copf without a semi-colon" do
+    input = "&Copf"
+    output = [["Character", "&Copf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Coproduct without a semi-colon" do
+    input = "&Coproduct"
+    output = [["Character", "&Coproduct"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CounterClockwiseContourIntegral without a semi-colon" do
+    input = "&CounterClockwiseContourIntegral"
+    output = [["Character", "&CounterClockwiseContourIntegral"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cross without a semi-colon" do
+    input = "&Cross"
+    output = [["Character", "&Cross"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cscr without a semi-colon" do
+    input = "&Cscr"
+    output = [["Character", "&Cscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Cup without a semi-colon" do
+    input = "&Cup"
+    output = [["Character", "&Cup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: CupCap without a semi-colon" do
+    input = "&CupCap"
+    output = [["Character", "&CupCap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DD without a semi-colon" do
+    input = "&DD"
+    output = [["Character", "&DD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DDotrahd without a semi-colon" do
+    input = "&DDotrahd"
+    output = [["Character", "&DDotrahd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DJcy without a semi-colon" do
+    input = "&DJcy"
+    output = [["Character", "&DJcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DScy without a semi-colon" do
+    input = "&DScy"
+    output = [["Character", "&DScy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DZcy without a semi-colon" do
+    input = "&DZcy"
+    output = [["Character", "&DZcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dagger without a semi-colon" do
+    input = "&Dagger"
+    output = [["Character", "&Dagger"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Darr without a semi-colon" do
+    input = "&Darr"
+    output = [["Character", "&Darr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dashv without a semi-colon" do
+    input = "&Dashv"
+    output = [["Character", "&Dashv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dcaron without a semi-colon" do
+    input = "&Dcaron"
+    output = [["Character", "&Dcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dcy without a semi-colon" do
+    input = "&Dcy"
+    output = [["Character", "&Dcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Del without a semi-colon" do
+    input = "&Del"
+    output = [["Character", "&Del"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Delta without a semi-colon" do
+    input = "&Delta"
+    output = [["Character", "&Delta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dfr without a semi-colon" do
+    input = "&Dfr"
+    output = [["Character", "&Dfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DiacriticalAcute without a semi-colon" do
+    input = "&DiacriticalAcute"
+    output = [["Character", "&DiacriticalAcute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DiacriticalDot without a semi-colon" do
+    input = "&DiacriticalDot"
+    output = [["Character", "&DiacriticalDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DiacriticalDoubleAcute without a semi-colon" do
+    input = "&DiacriticalDoubleAcute"
+    output = [["Character", "&DiacriticalDoubleAcute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DiacriticalGrave without a semi-colon" do
+    input = "&DiacriticalGrave"
+    output = [["Character", "&DiacriticalGrave"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DiacriticalTilde without a semi-colon" do
+    input = "&DiacriticalTilde"
+    output = [["Character", "&DiacriticalTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Diamond without a semi-colon" do
+    input = "&Diamond"
+    output = [["Character", "&Diamond"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DifferentialD without a semi-colon" do
+    input = "&DifferentialD"
+    output = [["Character", "&DifferentialD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dopf without a semi-colon" do
+    input = "&Dopf"
+    output = [["Character", "&Dopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dot without a semi-colon" do
+    input = "&Dot"
+    output = [["Character", "&Dot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DotDot without a semi-colon" do
+    input = "&DotDot"
+    output = [["Character", "&DotDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DotEqual without a semi-colon" do
+    input = "&DotEqual"
+    output = [["Character", "&DotEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleContourIntegral without a semi-colon" do
+    input = "&DoubleContourIntegral"
+    output = [["Character", "&DoubleContourIntegral"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleDot without a semi-colon" do
+    input = "&DoubleDot"
+    output = [["Character", "&DoubleDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleDownArrow without a semi-colon" do
+    input = "&DoubleDownArrow"
+    output = [["Character", "&DoubleDownArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleLeftArrow without a semi-colon" do
+    input = "&DoubleLeftArrow"
+    output = [["Character", "&DoubleLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleLeftRightArrow without a semi-colon" do
+    input = "&DoubleLeftRightArrow"
+    output = [["Character", "&DoubleLeftRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleLeftTee without a semi-colon" do
+    input = "&DoubleLeftTee"
+    output = [["Character", "&DoubleLeftTee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleLongLeftArrow without a semi-colon" do
+    input = "&DoubleLongLeftArrow"
+    output = [["Character", "&DoubleLongLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleLongLeftRightArrow without a semi-colon" do
+    input = "&DoubleLongLeftRightArrow"
+    output = [["Character", "&DoubleLongLeftRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleLongRightArrow without a semi-colon" do
+    input = "&DoubleLongRightArrow"
+    output = [["Character", "&DoubleLongRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleRightArrow without a semi-colon" do
+    input = "&DoubleRightArrow"
+    output = [["Character", "&DoubleRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleRightTee without a semi-colon" do
+    input = "&DoubleRightTee"
+    output = [["Character", "&DoubleRightTee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleUpArrow without a semi-colon" do
+    input = "&DoubleUpArrow"
+    output = [["Character", "&DoubleUpArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleUpDownArrow without a semi-colon" do
+    input = "&DoubleUpDownArrow"
+    output = [["Character", "&DoubleUpDownArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DoubleVerticalBar without a semi-colon" do
+    input = "&DoubleVerticalBar"
+    output = [["Character", "&DoubleVerticalBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownArrow without a semi-colon" do
+    input = "&DownArrow"
+    output = [["Character", "&DownArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownArrowBar without a semi-colon" do
+    input = "&DownArrowBar"
+    output = [["Character", "&DownArrowBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownArrowUpArrow without a semi-colon" do
+    input = "&DownArrowUpArrow"
+    output = [["Character", "&DownArrowUpArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownBreve without a semi-colon" do
+    input = "&DownBreve"
+    output = [["Character", "&DownBreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownLeftRightVector without a semi-colon" do
+    input = "&DownLeftRightVector"
+    output = [["Character", "&DownLeftRightVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownLeftTeeVector without a semi-colon" do
+    input = "&DownLeftTeeVector"
+    output = [["Character", "&DownLeftTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownLeftVector without a semi-colon" do
+    input = "&DownLeftVector"
+    output = [["Character", "&DownLeftVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part20_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part20_test.exs
new file mode 100644
index 00000000..6813410a
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part20_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart20Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: vartriangleleft without a semi-colon" do
+    input = "&vartriangleleft"
+    output = [["Character", "&vartriangleleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vartriangleright without a semi-colon" do
+    input = "&vartriangleright"
+    output = [["Character", "&vartriangleright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vcy without a semi-colon" do
+    input = "&vcy"
+    output = [["Character", "&vcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vdash without a semi-colon" do
+    input = "&vdash"
+    output = [["Character", "&vdash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vee without a semi-colon" do
+    input = "&vee"
+    output = [["Character", "&vee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: veebar without a semi-colon" do
+    input = "&veebar"
+    output = [["Character", "&veebar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: veeeq without a semi-colon" do
+    input = "&veeeq"
+    output = [["Character", "&veeeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vellip without a semi-colon" do
+    input = "&vellip"
+    output = [["Character", "&vellip"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: verbar without a semi-colon" do
+    input = "&verbar"
+    output = [["Character", "&verbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vert without a semi-colon" do
+    input = "&vert"
+    output = [["Character", "&vert"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vfr without a semi-colon" do
+    input = "&vfr"
+    output = [["Character", "&vfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vltri without a semi-colon" do
+    input = "&vltri"
+    output = [["Character", "&vltri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vnsub without a semi-colon" do
+    input = "&vnsub"
+    output = [["Character", "&vnsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vnsup without a semi-colon" do
+    input = "&vnsup"
+    output = [["Character", "&vnsup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vopf without a semi-colon" do
+    input = "&vopf"
+    output = [["Character", "&vopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vprop without a semi-colon" do
+    input = "&vprop"
+    output = [["Character", "&vprop"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vrtri without a semi-colon" do
+    input = "&vrtri"
+    output = [["Character", "&vrtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vscr without a semi-colon" do
+    input = "&vscr"
+    output = [["Character", "&vscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vsubnE without a semi-colon" do
+    input = "&vsubnE"
+    output = [["Character", "&vsubnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vsubne without a semi-colon" do
+    input = "&vsubne"
+    output = [["Character", "&vsubne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vsupnE without a semi-colon" do
+    input = "&vsupnE"
+    output = [["Character", "&vsupnE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vsupne without a semi-colon" do
+    input = "&vsupne"
+    output = [["Character", "&vsupne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: vzigzag without a semi-colon" do
+    input = "&vzigzag"
+    output = [["Character", "&vzigzag"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wcirc without a semi-colon" do
+    input = "&wcirc"
+    output = [["Character", "&wcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wedbar without a semi-colon" do
+    input = "&wedbar"
+    output = [["Character", "&wedbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wedge without a semi-colon" do
+    input = "&wedge"
+    output = [["Character", "&wedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wedgeq without a semi-colon" do
+    input = "&wedgeq"
+    output = [["Character", "&wedgeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: weierp without a semi-colon" do
+    input = "&weierp"
+    output = [["Character", "&weierp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wfr without a semi-colon" do
+    input = "&wfr"
+    output = [["Character", "&wfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wopf without a semi-colon" do
+    input = "&wopf"
+    output = [["Character", "&wopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wp without a semi-colon" do
+    input = "&wp"
+    output = [["Character", "&wp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wr without a semi-colon" do
+    input = "&wr"
+    output = [["Character", "&wr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wreath without a semi-colon" do
+    input = "&wreath"
+    output = [["Character", "&wreath"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: wscr without a semi-colon" do
+    input = "&wscr"
+    output = [["Character", "&wscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xcap without a semi-colon" do
+    input = "&xcap"
+    output = [["Character", "&xcap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xcirc without a semi-colon" do
+    input = "&xcirc"
+    output = [["Character", "&xcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xcup without a semi-colon" do
+    input = "&xcup"
+    output = [["Character", "&xcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xdtri without a semi-colon" do
+    input = "&xdtri"
+    output = [["Character", "&xdtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xfr without a semi-colon" do
+    input = "&xfr"
+    output = [["Character", "&xfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xhArr without a semi-colon" do
+    input = "&xhArr"
+    output = [["Character", "&xhArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xharr without a semi-colon" do
+    input = "&xharr"
+    output = [["Character", "&xharr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xi without a semi-colon" do
+    input = "&xi"
+    output = [["Character", "&xi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xlArr without a semi-colon" do
+    input = "&xlArr"
+    output = [["Character", "&xlArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xlarr without a semi-colon" do
+    input = "&xlarr"
+    output = [["Character", "&xlarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xmap without a semi-colon" do
+    input = "&xmap"
+    output = [["Character", "&xmap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xnis without a semi-colon" do
+    input = "&xnis"
+    output = [["Character", "&xnis"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xodot without a semi-colon" do
+    input = "&xodot"
+    output = [["Character", "&xodot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xopf without a semi-colon" do
+    input = "&xopf"
+    output = [["Character", "&xopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xoplus without a semi-colon" do
+    input = "&xoplus"
+    output = [["Character", "&xoplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xotime without a semi-colon" do
+    input = "&xotime"
+    output = [["Character", "&xotime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xrArr without a semi-colon" do
+    input = "&xrArr"
+    output = [["Character", "&xrArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xrarr without a semi-colon" do
+    input = "&xrarr"
+    output = [["Character", "&xrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xscr without a semi-colon" do
+    input = "&xscr"
+    output = [["Character", "&xscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xsqcup without a semi-colon" do
+    input = "&xsqcup"
+    output = [["Character", "&xsqcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xuplus without a semi-colon" do
+    input = "&xuplus"
+    output = [["Character", "&xuplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xutri without a semi-colon" do
+    input = "&xutri"
+    output = [["Character", "&xutri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xvee without a semi-colon" do
+    input = "&xvee"
+    output = [["Character", "&xvee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: xwedge without a semi-colon" do
+    input = "&xwedge"
+    output = [["Character", "&xwedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: yacy without a semi-colon" do
+    input = "&yacy"
+    output = [["Character", "&yacy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ycirc without a semi-colon" do
+    input = "&ycirc"
+    output = [["Character", "&ycirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ycy without a semi-colon" do
+    input = "&ycy"
+    output = [["Character", "&ycy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: yfr without a semi-colon" do
+    input = "&yfr"
+    output = [["Character", "&yfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: yicy without a semi-colon" do
+    input = "&yicy"
+    output = [["Character", "&yicy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: yopf without a semi-colon" do
+    input = "&yopf"
+    output = [["Character", "&yopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: yscr without a semi-colon" do
+    input = "&yscr"
+    output = [["Character", "&yscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: yucy without a semi-colon" do
+    input = "&yucy"
+    output = [["Character", "&yucy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zacute without a semi-colon" do
+    input = "&zacute"
+    output = [["Character", "&zacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zcaron without a semi-colon" do
+    input = "&zcaron"
+    output = [["Character", "&zcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zcy without a semi-colon" do
+    input = "&zcy"
+    output = [["Character", "&zcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zdot without a semi-colon" do
+    input = "&zdot"
+    output = [["Character", "&zdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zeetrf without a semi-colon" do
+    input = "&zeetrf"
+    output = [["Character", "&zeetrf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zeta without a semi-colon" do
+    input = "&zeta"
+    output = [["Character", "&zeta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zfr without a semi-colon" do
+    input = "&zfr"
+    output = [["Character", "&zfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zhcy without a semi-colon" do
+    input = "&zhcy"
+    output = [["Character", "&zhcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zigrarr without a semi-colon" do
+    input = "&zigrarr"
+    output = [["Character", "&zigrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zopf without a semi-colon" do
+    input = "&zopf"
+    output = [["Character", "&zopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zscr without a semi-colon" do
+    input = "&zscr"
+    output = [["Character", "&zscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zwj without a semi-colon" do
+    input = "&zwj"
+    output = [["Character", "&zwj"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: zwnj without a semi-colon" do
+    input = "&zwnj"
+    output = [["Character", "&zwnj"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: AElig without a semi-colon" do
+    input = "&AElig"
+    output = [["Character", "Æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: AElig; with a semi-colon" do
+    input = "&AElig;"
+    output = [["Character", "Æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: AMP without a semi-colon" do
+    input = "&AMP"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: AMP; with a semi-colon" do
+    input = "&AMP;"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Aacute without a semi-colon" do
+    input = "&Aacute"
+    output = [["Character", "Á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Aacute; with a semi-colon" do
+    input = "&Aacute;"
+    output = [["Character", "Á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Abreve; with a semi-colon" do
+    input = "&Abreve;"
+    output = [["Character", "Ă"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Acirc without a semi-colon" do
+    input = "&Acirc"
+    output = [["Character", "Â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Acirc; with a semi-colon" do
+    input = "&Acirc;"
+    output = [["Character", "Â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Acy; with a semi-colon" do
+    input = "&Acy;"
+    output = [["Character", "А"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Afr; with a semi-colon" do
+    input = "&Afr;"
+    output = [["Character", "𝔄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Agrave without a semi-colon" do
+    input = "&Agrave"
+    output = [["Character", "À"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Agrave; with a semi-colon" do
+    input = "&Agrave;"
+    output = [["Character", "À"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Alpha; with a semi-colon" do
+    input = "&Alpha;"
+    output = [["Character", "Α"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Amacr; with a semi-colon" do
+    input = "&Amacr;"
+    output = [["Character", "Ā"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: And; with a semi-colon" do
+    input = "&And;"
+    output = [["Character", "⩓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Aogon; with a semi-colon" do
+    input = "&Aogon;"
+    output = [["Character", "Ą"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Aopf; with a semi-colon" do
+    input = "&Aopf;"
+    output = [["Character", "𝔸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ApplyFunction; with a semi-colon" do
+    input = "&ApplyFunction;"
+    output = [["Character", "⁡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Aring without a semi-colon" do
+    input = "&Aring"
+    output = [["Character", "Å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Aring; with a semi-colon" do
+    input = "&Aring;"
+    output = [["Character", "Å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part21_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part21_test.exs
new file mode 100644
index 00000000..294d1f2a
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part21_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart21Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: Ascr; with a semi-colon" do
+    input = "&Ascr;"
+    output = [["Character", "𝒜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Assign; with a semi-colon" do
+    input = "&Assign;"
+    output = [["Character", "≔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Atilde without a semi-colon" do
+    input = "&Atilde"
+    output = [["Character", "Ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Atilde; with a semi-colon" do
+    input = "&Atilde;"
+    output = [["Character", "Ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Auml without a semi-colon" do
+    input = "&Auml"
+    output = [["Character", "Ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Auml; with a semi-colon" do
+    input = "&Auml;"
+    output = [["Character", "Ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Backslash; with a semi-colon" do
+    input = "&Backslash;"
+    output = [["Character", "∖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Barv; with a semi-colon" do
+    input = "&Barv;"
+    output = [["Character", "⫧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Barwed; with a semi-colon" do
+    input = "&Barwed;"
+    output = [["Character", "⌆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Bcy; with a semi-colon" do
+    input = "&Bcy;"
+    output = [["Character", "Б"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Because; with a semi-colon" do
+    input = "&Because;"
+    output = [["Character", "∵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Bernoullis; with a semi-colon" do
+    input = "&Bernoullis;"
+    output = [["Character", "ℬ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Beta; with a semi-colon" do
+    input = "&Beta;"
+    output = [["Character", "Β"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Bfr; with a semi-colon" do
+    input = "&Bfr;"
+    output = [["Character", "𝔅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Bopf; with a semi-colon" do
+    input = "&Bopf;"
+    output = [["Character", "𝔹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Breve; with a semi-colon" do
+    input = "&Breve;"
+    output = [["Character", "˘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Bscr; with a semi-colon" do
+    input = "&Bscr;"
+    output = [["Character", "ℬ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Bumpeq; with a semi-colon" do
+    input = "&Bumpeq;"
+    output = [["Character", "≎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CHcy; with a semi-colon" do
+    input = "&CHcy;"
+    output = [["Character", "Ч"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: COPY without a semi-colon" do
+    input = "&COPY"
+    output = [["Character", "©"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: COPY; with a semi-colon" do
+    input = "&COPY;"
+    output = [["Character", "©"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cacute; with a semi-colon" do
+    input = "&Cacute;"
+    output = [["Character", "Ć"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cap; with a semi-colon" do
+    input = "&Cap;"
+    output = [["Character", "⋒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CapitalDifferentialD; with a semi-colon" do
+    input = "&CapitalDifferentialD;"
+    output = [["Character", "ⅅ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cayleys; with a semi-colon" do
+    input = "&Cayleys;"
+    output = [["Character", "ℭ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ccaron; with a semi-colon" do
+    input = "&Ccaron;"
+    output = [["Character", "Č"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ccedil without a semi-colon" do
+    input = "&Ccedil"
+    output = [["Character", "Ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ccedil; with a semi-colon" do
+    input = "&Ccedil;"
+    output = [["Character", "Ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ccirc; with a semi-colon" do
+    input = "&Ccirc;"
+    output = [["Character", "Ĉ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cconint; with a semi-colon" do
+    input = "&Cconint;"
+    output = [["Character", "∰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cdot; with a semi-colon" do
+    input = "&Cdot;"
+    output = [["Character", "Ċ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cedilla; with a semi-colon" do
+    input = "&Cedilla;"
+    output = [["Character", "¸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CenterDot; with a semi-colon" do
+    input = "&CenterDot;"
+    output = [["Character", "·"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cfr; with a semi-colon" do
+    input = "&Cfr;"
+    output = [["Character", "ℭ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Chi; with a semi-colon" do
+    input = "&Chi;"
+    output = [["Character", "Χ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CircleDot; with a semi-colon" do
+    input = "&CircleDot;"
+    output = [["Character", "⊙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CircleMinus; with a semi-colon" do
+    input = "&CircleMinus;"
+    output = [["Character", "⊖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CirclePlus; with a semi-colon" do
+    input = "&CirclePlus;"
+    output = [["Character", "⊕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CircleTimes; with a semi-colon" do
+    input = "&CircleTimes;"
+    output = [["Character", "⊗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ClockwiseContourIntegral; with a semi-colon" do
+    input = "&ClockwiseContourIntegral;"
+    output = [["Character", "∲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CloseCurlyDoubleQuote; with a semi-colon" do
+    input = "&CloseCurlyDoubleQuote;"
+    output = [["Character", "”"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CloseCurlyQuote; with a semi-colon" do
+    input = "&CloseCurlyQuote;"
+    output = [["Character", "’"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Colon; with a semi-colon" do
+    input = "&Colon;"
+    output = [["Character", "∷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Colone; with a semi-colon" do
+    input = "&Colone;"
+    output = [["Character", "⩴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Congruent; with a semi-colon" do
+    input = "&Congruent;"
+    output = [["Character", "≡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Conint; with a semi-colon" do
+    input = "&Conint;"
+    output = [["Character", "∯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ContourIntegral; with a semi-colon" do
+    input = "&ContourIntegral;"
+    output = [["Character", "∮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Copf; with a semi-colon" do
+    input = "&Copf;"
+    output = [["Character", "ℂ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Coproduct; with a semi-colon" do
+    input = "&Coproduct;"
+    output = [["Character", "∐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CounterClockwiseContourIntegral; with a semi-colon" do
+    input = "&CounterClockwiseContourIntegral;"
+    output = [["Character", "∳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cross; with a semi-colon" do
+    input = "&Cross;"
+    output = [["Character", "⨯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cscr; with a semi-colon" do
+    input = "&Cscr;"
+    output = [["Character", "𝒞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Cup; with a semi-colon" do
+    input = "&Cup;"
+    output = [["Character", "⋓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: CupCap; with a semi-colon" do
+    input = "&CupCap;"
+    output = [["Character", "≍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DD; with a semi-colon" do
+    input = "&DD;"
+    output = [["Character", "ⅅ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DDotrahd; with a semi-colon" do
+    input = "&DDotrahd;"
+    output = [["Character", "⤑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DJcy; with a semi-colon" do
+    input = "&DJcy;"
+    output = [["Character", "Ђ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DScy; with a semi-colon" do
+    input = "&DScy;"
+    output = [["Character", "Ѕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DZcy; with a semi-colon" do
+    input = "&DZcy;"
+    output = [["Character", "Џ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dagger; with a semi-colon" do
+    input = "&Dagger;"
+    output = [["Character", "‡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Darr; with a semi-colon" do
+    input = "&Darr;"
+    output = [["Character", "↡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dashv; with a semi-colon" do
+    input = "&Dashv;"
+    output = [["Character", "⫤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dcaron; with a semi-colon" do
+    input = "&Dcaron;"
+    output = [["Character", "Ď"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dcy; with a semi-colon" do
+    input = "&Dcy;"
+    output = [["Character", "Д"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Del; with a semi-colon" do
+    input = "&Del;"
+    output = [["Character", "∇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Delta; with a semi-colon" do
+    input = "&Delta;"
+    output = [["Character", "Δ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dfr; with a semi-colon" do
+    input = "&Dfr;"
+    output = [["Character", "𝔇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DiacriticalAcute; with a semi-colon" do
+    input = "&DiacriticalAcute;"
+    output = [["Character", "´"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DiacriticalDot; with a semi-colon" do
+    input = "&DiacriticalDot;"
+    output = [["Character", "˙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DiacriticalDoubleAcute; with a semi-colon" do
+    input = "&DiacriticalDoubleAcute;"
+    output = [["Character", "˝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DiacriticalGrave; with a semi-colon" do
+    input = "&DiacriticalGrave;"
+    output = [["Character", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DiacriticalTilde; with a semi-colon" do
+    input = "&DiacriticalTilde;"
+    output = [["Character", "˜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Diamond; with a semi-colon" do
+    input = "&Diamond;"
+    output = [["Character", "⋄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DifferentialD; with a semi-colon" do
+    input = "&DifferentialD;"
+    output = [["Character", "ⅆ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dopf; with a semi-colon" do
+    input = "&Dopf;"
+    output = [["Character", "𝔻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dot; with a semi-colon" do
+    input = "&Dot;"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DotDot; with a semi-colon" do
+    input = "&DotDot;"
+    output = [["Character", "⃜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DotEqual; with a semi-colon" do
+    input = "&DotEqual;"
+    output = [["Character", "≐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleContourIntegral; with a semi-colon" do
+    input = "&DoubleContourIntegral;"
+    output = [["Character", "∯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleDot; with a semi-colon" do
+    input = "&DoubleDot;"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleDownArrow; with a semi-colon" do
+    input = "&DoubleDownArrow;"
+    output = [["Character", "⇓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleLeftArrow; with a semi-colon" do
+    input = "&DoubleLeftArrow;"
+    output = [["Character", "⇐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleLeftRightArrow; with a semi-colon" do
+    input = "&DoubleLeftRightArrow;"
+    output = [["Character", "⇔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleLeftTee; with a semi-colon" do
+    input = "&DoubleLeftTee;"
+    output = [["Character", "⫤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleLongLeftArrow; with a semi-colon" do
+    input = "&DoubleLongLeftArrow;"
+    output = [["Character", "⟸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleLongLeftRightArrow; with a semi-colon" do
+    input = "&DoubleLongLeftRightArrow;"
+    output = [["Character", "⟺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleLongRightArrow; with a semi-colon" do
+    input = "&DoubleLongRightArrow;"
+    output = [["Character", "⟹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleRightArrow; with a semi-colon" do
+    input = "&DoubleRightArrow;"
+    output = [["Character", "⇒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleRightTee; with a semi-colon" do
+    input = "&DoubleRightTee;"
+    output = [["Character", "⊨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleUpArrow; with a semi-colon" do
+    input = "&DoubleUpArrow;"
+    output = [["Character", "⇑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleUpDownArrow; with a semi-colon" do
+    input = "&DoubleUpDownArrow;"
+    output = [["Character", "⇕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DoubleVerticalBar; with a semi-colon" do
+    input = "&DoubleVerticalBar;"
+    output = [["Character", "∥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownArrow; with a semi-colon" do
+    input = "&DownArrow;"
+    output = [["Character", "↓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownArrowBar; with a semi-colon" do
+    input = "&DownArrowBar;"
+    output = [["Character", "⤓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownArrowUpArrow; with a semi-colon" do
+    input = "&DownArrowUpArrow;"
+    output = [["Character", "⇵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownBreve; with a semi-colon" do
+    input = "&DownBreve;"
+    output = [["Character", "̑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownLeftRightVector; with a semi-colon" do
+    input = "&DownLeftRightVector;"
+    output = [["Character", "⥐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownLeftTeeVector; with a semi-colon" do
+    input = "&DownLeftTeeVector;"
+    output = [["Character", "⥞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownLeftVector; with a semi-colon" do
+    input = "&DownLeftVector;"
+    output = [["Character", "↽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownLeftVectorBar; with a semi-colon" do
+    input = "&DownLeftVectorBar;"
+    output = [["Character", "⥖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part22_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part22_test.exs
new file mode 100644
index 00000000..2e3fd806
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part22_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart22Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: DownRightTeeVector; with a semi-colon" do
+    input = "&DownRightTeeVector;"
+    output = [["Character", "⥟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownRightVector; with a semi-colon" do
+    input = "&DownRightVector;"
+    output = [["Character", "⇁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownRightVectorBar; with a semi-colon" do
+    input = "&DownRightVectorBar;"
+    output = [["Character", "⥗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownTee; with a semi-colon" do
+    input = "&DownTee;"
+    output = [["Character", "⊤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: DownTeeArrow; with a semi-colon" do
+    input = "&DownTeeArrow;"
+    output = [["Character", "↧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Downarrow; with a semi-colon" do
+    input = "&Downarrow;"
+    output = [["Character", "⇓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dscr; with a semi-colon" do
+    input = "&Dscr;"
+    output = [["Character", "𝒟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Dstrok; with a semi-colon" do
+    input = "&Dstrok;"
+    output = [["Character", "Đ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ENG; with a semi-colon" do
+    input = "&ENG;"
+    output = [["Character", "Ŋ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ETH without a semi-colon" do
+    input = "&ETH"
+    output = [["Character", "Ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ETH; with a semi-colon" do
+    input = "&ETH;"
+    output = [["Character", "Ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Eacute without a semi-colon" do
+    input = "&Eacute"
+    output = [["Character", "É"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Eacute; with a semi-colon" do
+    input = "&Eacute;"
+    output = [["Character", "É"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ecaron; with a semi-colon" do
+    input = "&Ecaron;"
+    output = [["Character", "Ě"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ecirc without a semi-colon" do
+    input = "&Ecirc"
+    output = [["Character", "Ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ecirc; with a semi-colon" do
+    input = "&Ecirc;"
+    output = [["Character", "Ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ecy; with a semi-colon" do
+    input = "&Ecy;"
+    output = [["Character", "Э"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Edot; with a semi-colon" do
+    input = "&Edot;"
+    output = [["Character", "Ė"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Efr; with a semi-colon" do
+    input = "&Efr;"
+    output = [["Character", "𝔈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Egrave without a semi-colon" do
+    input = "&Egrave"
+    output = [["Character", "È"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Egrave; with a semi-colon" do
+    input = "&Egrave;"
+    output = [["Character", "È"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Element; with a semi-colon" do
+    input = "&Element;"
+    output = [["Character", "∈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Emacr; with a semi-colon" do
+    input = "&Emacr;"
+    output = [["Character", "Ē"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: EmptySmallSquare; with a semi-colon" do
+    input = "&EmptySmallSquare;"
+    output = [["Character", "◻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: EmptyVerySmallSquare; with a semi-colon" do
+    input = "&EmptyVerySmallSquare;"
+    output = [["Character", "▫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Eogon; with a semi-colon" do
+    input = "&Eogon;"
+    output = [["Character", "Ę"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Eopf; with a semi-colon" do
+    input = "&Eopf;"
+    output = [["Character", "𝔼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Epsilon; with a semi-colon" do
+    input = "&Epsilon;"
+    output = [["Character", "Ε"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Equal; with a semi-colon" do
+    input = "&Equal;"
+    output = [["Character", "⩵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: EqualTilde; with a semi-colon" do
+    input = "&EqualTilde;"
+    output = [["Character", "≂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Equilibrium; with a semi-colon" do
+    input = "&Equilibrium;"
+    output = [["Character", "⇌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Escr; with a semi-colon" do
+    input = "&Escr;"
+    output = [["Character", "ℰ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Esim; with a semi-colon" do
+    input = "&Esim;"
+    output = [["Character", "⩳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Eta; with a semi-colon" do
+    input = "&Eta;"
+    output = [["Character", "Η"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Euml without a semi-colon" do
+    input = "&Euml"
+    output = [["Character", "Ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Euml; with a semi-colon" do
+    input = "&Euml;"
+    output = [["Character", "Ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Exists; with a semi-colon" do
+    input = "&Exists;"
+    output = [["Character", "∃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ExponentialE; with a semi-colon" do
+    input = "&ExponentialE;"
+    output = [["Character", "ⅇ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Fcy; with a semi-colon" do
+    input = "&Fcy;"
+    output = [["Character", "Ф"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ffr; with a semi-colon" do
+    input = "&Ffr;"
+    output = [["Character", "𝔉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: FilledSmallSquare; with a semi-colon" do
+    input = "&FilledSmallSquare;"
+    output = [["Character", "◼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: FilledVerySmallSquare; with a semi-colon" do
+    input = "&FilledVerySmallSquare;"
+    output = [["Character", "▪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Fopf; with a semi-colon" do
+    input = "&Fopf;"
+    output = [["Character", "𝔽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ForAll; with a semi-colon" do
+    input = "&ForAll;"
+    output = [["Character", "∀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Fouriertrf; with a semi-colon" do
+    input = "&Fouriertrf;"
+    output = [["Character", "ℱ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Fscr; with a semi-colon" do
+    input = "&Fscr;"
+    output = [["Character", "ℱ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GJcy; with a semi-colon" do
+    input = "&GJcy;"
+    output = [["Character", "Ѓ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GT without a semi-colon" do
+    input = "&GT"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GT; with a semi-colon" do
+    input = "&GT;"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gamma; with a semi-colon" do
+    input = "&Gamma;"
+    output = [["Character", "Γ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gammad; with a semi-colon" do
+    input = "&Gammad;"
+    output = [["Character", "Ϝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gbreve; with a semi-colon" do
+    input = "&Gbreve;"
+    output = [["Character", "Ğ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gcedil; with a semi-colon" do
+    input = "&Gcedil;"
+    output = [["Character", "Ģ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gcirc; with a semi-colon" do
+    input = "&Gcirc;"
+    output = [["Character", "Ĝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gcy; with a semi-colon" do
+    input = "&Gcy;"
+    output = [["Character", "Г"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gdot; with a semi-colon" do
+    input = "&Gdot;"
+    output = [["Character", "Ġ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gfr; with a semi-colon" do
+    input = "&Gfr;"
+    output = [["Character", "𝔊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gg; with a semi-colon" do
+    input = "&Gg;"
+    output = [["Character", "⋙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gopf; with a semi-colon" do
+    input = "&Gopf;"
+    output = [["Character", "𝔾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterEqual; with a semi-colon" do
+    input = "&GreaterEqual;"
+    output = [["Character", "≥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterEqualLess; with a semi-colon" do
+    input = "&GreaterEqualLess;"
+    output = [["Character", "⋛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterFullEqual; with a semi-colon" do
+    input = "&GreaterFullEqual;"
+    output = [["Character", "≧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterGreater; with a semi-colon" do
+    input = "&GreaterGreater;"
+    output = [["Character", "⪢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterLess; with a semi-colon" do
+    input = "&GreaterLess;"
+    output = [["Character", "≷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterSlantEqual; with a semi-colon" do
+    input = "&GreaterSlantEqual;"
+    output = [["Character", "⩾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: GreaterTilde; with a semi-colon" do
+    input = "&GreaterTilde;"
+    output = [["Character", "≳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gscr; with a semi-colon" do
+    input = "&Gscr;"
+    output = [["Character", "𝒢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Gt; with a semi-colon" do
+    input = "&Gt;"
+    output = [["Character", "≫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: HARDcy; with a semi-colon" do
+    input = "&HARDcy;"
+    output = [["Character", "Ъ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hacek; with a semi-colon" do
+    input = "&Hacek;"
+    output = [["Character", "ˇ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hat; with a semi-colon" do
+    input = "&Hat;"
+    output = [["Character", "^"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hcirc; with a semi-colon" do
+    input = "&Hcirc;"
+    output = [["Character", "Ĥ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hfr; with a semi-colon" do
+    input = "&Hfr;"
+    output = [["Character", "ℌ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: HilbertSpace; with a semi-colon" do
+    input = "&HilbertSpace;"
+    output = [["Character", "ℋ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hopf; with a semi-colon" do
+    input = "&Hopf;"
+    output = [["Character", "ℍ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: HorizontalLine; with a semi-colon" do
+    input = "&HorizontalLine;"
+    output = [["Character", "─"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hscr; with a semi-colon" do
+    input = "&Hscr;"
+    output = [["Character", "ℋ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Hstrok; with a semi-colon" do
+    input = "&Hstrok;"
+    output = [["Character", "Ħ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: HumpDownHump; with a semi-colon" do
+    input = "&HumpDownHump;"
+    output = [["Character", "≎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: HumpEqual; with a semi-colon" do
+    input = "&HumpEqual;"
+    output = [["Character", "≏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: IEcy; with a semi-colon" do
+    input = "&IEcy;"
+    output = [["Character", "Е"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: IJlig; with a semi-colon" do
+    input = "&IJlig;"
+    output = [["Character", "Ĳ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: IOcy; with a semi-colon" do
+    input = "&IOcy;"
+    output = [["Character", "Ё"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iacute without a semi-colon" do
+    input = "&Iacute"
+    output = [["Character", "Í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iacute; with a semi-colon" do
+    input = "&Iacute;"
+    output = [["Character", "Í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Icirc without a semi-colon" do
+    input = "&Icirc"
+    output = [["Character", "Î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Icirc; with a semi-colon" do
+    input = "&Icirc;"
+    output = [["Character", "Î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Icy; with a semi-colon" do
+    input = "&Icy;"
+    output = [["Character", "И"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Idot; with a semi-colon" do
+    input = "&Idot;"
+    output = [["Character", "İ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ifr; with a semi-colon" do
+    input = "&Ifr;"
+    output = [["Character", "ℑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Igrave without a semi-colon" do
+    input = "&Igrave"
+    output = [["Character", "Ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Igrave; with a semi-colon" do
+    input = "&Igrave;"
+    output = [["Character", "Ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Im; with a semi-colon" do
+    input = "&Im;"
+    output = [["Character", "ℑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Imacr; with a semi-colon" do
+    input = "&Imacr;"
+    output = [["Character", "Ī"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ImaginaryI; with a semi-colon" do
+    input = "&ImaginaryI;"
+    output = [["Character", "ⅈ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Implies; with a semi-colon" do
+    input = "&Implies;"
+    output = [["Character", "⇒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Int; with a semi-colon" do
+    input = "&Int;"
+    output = [["Character", "∬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Integral; with a semi-colon" do
+    input = "&Integral;"
+    output = [["Character", "∫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Intersection; with a semi-colon" do
+    input = "&Intersection;"
+    output = [["Character", "⋂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: InvisibleComma; with a semi-colon" do
+    input = "&InvisibleComma;"
+    output = [["Character", "⁣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part23_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part23_test.exs
new file mode 100644
index 00000000..028b1467
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part23_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart23Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: InvisibleTimes; with a semi-colon" do
+    input = "&InvisibleTimes;"
+    output = [["Character", "⁢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iogon; with a semi-colon" do
+    input = "&Iogon;"
+    output = [["Character", "Į"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iopf; with a semi-colon" do
+    input = "&Iopf;"
+    output = [["Character", "𝕀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iota; with a semi-colon" do
+    input = "&Iota;"
+    output = [["Character", "Ι"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iscr; with a semi-colon" do
+    input = "&Iscr;"
+    output = [["Character", "ℐ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Itilde; with a semi-colon" do
+    input = "&Itilde;"
+    output = [["Character", "Ĩ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iukcy; with a semi-colon" do
+    input = "&Iukcy;"
+    output = [["Character", "І"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iuml without a semi-colon" do
+    input = "&Iuml"
+    output = [["Character", "Ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Iuml; with a semi-colon" do
+    input = "&Iuml;"
+    output = [["Character", "Ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jcirc; with a semi-colon" do
+    input = "&Jcirc;"
+    output = [["Character", "Ĵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jcy; with a semi-colon" do
+    input = "&Jcy;"
+    output = [["Character", "Й"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jfr; with a semi-colon" do
+    input = "&Jfr;"
+    output = [["Character", "𝔍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jopf; with a semi-colon" do
+    input = "&Jopf;"
+    output = [["Character", "𝕁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jscr; with a semi-colon" do
+    input = "&Jscr;"
+    output = [["Character", "𝒥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jsercy; with a semi-colon" do
+    input = "&Jsercy;"
+    output = [["Character", "Ј"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Jukcy; with a semi-colon" do
+    input = "&Jukcy;"
+    output = [["Character", "Є"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: KHcy; with a semi-colon" do
+    input = "&KHcy;"
+    output = [["Character", "Х"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: KJcy; with a semi-colon" do
+    input = "&KJcy;"
+    output = [["Character", "Ќ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Kappa; with a semi-colon" do
+    input = "&Kappa;"
+    output = [["Character", "Κ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Kcedil; with a semi-colon" do
+    input = "&Kcedil;"
+    output = [["Character", "Ķ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Kcy; with a semi-colon" do
+    input = "&Kcy;"
+    output = [["Character", "К"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Kfr; with a semi-colon" do
+    input = "&Kfr;"
+    output = [["Character", "𝔎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Kopf; with a semi-colon" do
+    input = "&Kopf;"
+    output = [["Character", "𝕂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Kscr; with a semi-colon" do
+    input = "&Kscr;"
+    output = [["Character", "𝒦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LJcy; with a semi-colon" do
+    input = "&LJcy;"
+    output = [["Character", "Љ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LT without a semi-colon" do
+    input = "&LT"
+    output = [["Character", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LT; with a semi-colon" do
+    input = "&LT;"
+    output = [["Character", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lacute; with a semi-colon" do
+    input = "&Lacute;"
+    output = [["Character", "Ĺ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lambda; with a semi-colon" do
+    input = "&Lambda;"
+    output = [["Character", "Λ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lang; with a semi-colon" do
+    input = "&Lang;"
+    output = [["Character", "⟪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Laplacetrf; with a semi-colon" do
+    input = "&Laplacetrf;"
+    output = [["Character", "ℒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Larr; with a semi-colon" do
+    input = "&Larr;"
+    output = [["Character", "↞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lcaron; with a semi-colon" do
+    input = "&Lcaron;"
+    output = [["Character", "Ľ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lcedil; with a semi-colon" do
+    input = "&Lcedil;"
+    output = [["Character", "Ļ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lcy; with a semi-colon" do
+    input = "&Lcy;"
+    output = [["Character", "Л"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftAngleBracket; with a semi-colon" do
+    input = "&LeftAngleBracket;"
+    output = [["Character", "⟨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftArrow; with a semi-colon" do
+    input = "&LeftArrow;"
+    output = [["Character", "←"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftArrowBar; with a semi-colon" do
+    input = "&LeftArrowBar;"
+    output = [["Character", "⇤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftArrowRightArrow; with a semi-colon" do
+    input = "&LeftArrowRightArrow;"
+    output = [["Character", "⇆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftCeiling; with a semi-colon" do
+    input = "&LeftCeiling;"
+    output = [["Character", "⌈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftDoubleBracket; with a semi-colon" do
+    input = "&LeftDoubleBracket;"
+    output = [["Character", "⟦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftDownTeeVector; with a semi-colon" do
+    input = "&LeftDownTeeVector;"
+    output = [["Character", "⥡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftDownVector; with a semi-colon" do
+    input = "&LeftDownVector;"
+    output = [["Character", "⇃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftDownVectorBar; with a semi-colon" do
+    input = "&LeftDownVectorBar;"
+    output = [["Character", "⥙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftFloor; with a semi-colon" do
+    input = "&LeftFloor;"
+    output = [["Character", "⌊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftRightArrow; with a semi-colon" do
+    input = "&LeftRightArrow;"
+    output = [["Character", "↔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftRightVector; with a semi-colon" do
+    input = "&LeftRightVector;"
+    output = [["Character", "⥎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftTee; with a semi-colon" do
+    input = "&LeftTee;"
+    output = [["Character", "⊣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftTeeArrow; with a semi-colon" do
+    input = "&LeftTeeArrow;"
+    output = [["Character", "↤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftTeeVector; with a semi-colon" do
+    input = "&LeftTeeVector;"
+    output = [["Character", "⥚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftTriangle; with a semi-colon" do
+    input = "&LeftTriangle;"
+    output = [["Character", "⊲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftTriangleBar; with a semi-colon" do
+    input = "&LeftTriangleBar;"
+    output = [["Character", "⧏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftTriangleEqual; with a semi-colon" do
+    input = "&LeftTriangleEqual;"
+    output = [["Character", "⊴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftUpDownVector; with a semi-colon" do
+    input = "&LeftUpDownVector;"
+    output = [["Character", "⥑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftUpTeeVector; with a semi-colon" do
+    input = "&LeftUpTeeVector;"
+    output = [["Character", "⥠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftUpVector; with a semi-colon" do
+    input = "&LeftUpVector;"
+    output = [["Character", "↿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftUpVectorBar; with a semi-colon" do
+    input = "&LeftUpVectorBar;"
+    output = [["Character", "⥘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftVector; with a semi-colon" do
+    input = "&LeftVector;"
+    output = [["Character", "↼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LeftVectorBar; with a semi-colon" do
+    input = "&LeftVectorBar;"
+    output = [["Character", "⥒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Leftarrow; with a semi-colon" do
+    input = "&Leftarrow;"
+    output = [["Character", "⇐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Leftrightarrow; with a semi-colon" do
+    input = "&Leftrightarrow;"
+    output = [["Character", "⇔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LessEqualGreater; with a semi-colon" do
+    input = "&LessEqualGreater;"
+    output = [["Character", "⋚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LessFullEqual; with a semi-colon" do
+    input = "&LessFullEqual;"
+    output = [["Character", "≦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LessGreater; with a semi-colon" do
+    input = "&LessGreater;"
+    output = [["Character", "≶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LessLess; with a semi-colon" do
+    input = "&LessLess;"
+    output = [["Character", "⪡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LessSlantEqual; with a semi-colon" do
+    input = "&LessSlantEqual;"
+    output = [["Character", "⩽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LessTilde; with a semi-colon" do
+    input = "&LessTilde;"
+    output = [["Character", "≲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lfr; with a semi-colon" do
+    input = "&Lfr;"
+    output = [["Character", "𝔏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ll; with a semi-colon" do
+    input = "&Ll;"
+    output = [["Character", "⋘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lleftarrow; with a semi-colon" do
+    input = "&Lleftarrow;"
+    output = [["Character", "⇚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lmidot; with a semi-colon" do
+    input = "&Lmidot;"
+    output = [["Character", "Ŀ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LongLeftArrow; with a semi-colon" do
+    input = "&LongLeftArrow;"
+    output = [["Character", "⟵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LongLeftRightArrow; with a semi-colon" do
+    input = "&LongLeftRightArrow;"
+    output = [["Character", "⟷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LongRightArrow; with a semi-colon" do
+    input = "&LongRightArrow;"
+    output = [["Character", "⟶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Longleftarrow; with a semi-colon" do
+    input = "&Longleftarrow;"
+    output = [["Character", "⟸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Longleftrightarrow; with a semi-colon" do
+    input = "&Longleftrightarrow;"
+    output = [["Character", "⟺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Longrightarrow; with a semi-colon" do
+    input = "&Longrightarrow;"
+    output = [["Character", "⟹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lopf; with a semi-colon" do
+    input = "&Lopf;"
+    output = [["Character", "𝕃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LowerLeftArrow; with a semi-colon" do
+    input = "&LowerLeftArrow;"
+    output = [["Character", "↙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: LowerRightArrow; with a semi-colon" do
+    input = "&LowerRightArrow;"
+    output = [["Character", "↘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lscr; with a semi-colon" do
+    input = "&Lscr;"
+    output = [["Character", "ℒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lsh; with a semi-colon" do
+    input = "&Lsh;"
+    output = [["Character", "↰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lstrok; with a semi-colon" do
+    input = "&Lstrok;"
+    output = [["Character", "Ł"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Lt; with a semi-colon" do
+    input = "&Lt;"
+    output = [["Character", "≪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Map; with a semi-colon" do
+    input = "&Map;"
+    output = [["Character", "⤅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Mcy; with a semi-colon" do
+    input = "&Mcy;"
+    output = [["Character", "М"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: MediumSpace; with a semi-colon" do
+    input = "&MediumSpace;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Mellintrf; with a semi-colon" do
+    input = "&Mellintrf;"
+    output = [["Character", "ℳ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Mfr; with a semi-colon" do
+    input = "&Mfr;"
+    output = [["Character", "𝔐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: MinusPlus; with a semi-colon" do
+    input = "&MinusPlus;"
+    output = [["Character", "∓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Mopf; with a semi-colon" do
+    input = "&Mopf;"
+    output = [["Character", "𝕄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Mscr; with a semi-colon" do
+    input = "&Mscr;"
+    output = [["Character", "ℳ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Mu; with a semi-colon" do
+    input = "&Mu;"
+    output = [["Character", "Μ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NJcy; with a semi-colon" do
+    input = "&NJcy;"
+    output = [["Character", "Њ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Nacute; with a semi-colon" do
+    input = "&Nacute;"
+    output = [["Character", "Ń"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ncaron; with a semi-colon" do
+    input = "&Ncaron;"
+    output = [["Character", "Ň"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ncedil; with a semi-colon" do
+    input = "&Ncedil;"
+    output = [["Character", "Ņ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ncy; with a semi-colon" do
+    input = "&Ncy;"
+    output = [["Character", "Н"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NegativeMediumSpace; with a semi-colon" do
+    input = "&NegativeMediumSpace;"
+    output = [["Character", "​"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NegativeThickSpace; with a semi-colon" do
+    input = "&NegativeThickSpace;"
+    output = [["Character", "​"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part24_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part24_test.exs
new file mode 100644
index 00000000..369944ad
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part24_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart24Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: NegativeThinSpace; with a semi-colon" do
+    input = "&NegativeThinSpace;"
+    output = [["Character", "​"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NegativeVeryThinSpace; with a semi-colon" do
+    input = "&NegativeVeryThinSpace;"
+    output = [["Character", "​"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NestedGreaterGreater; with a semi-colon" do
+    input = "&NestedGreaterGreater;"
+    output = [["Character", "≫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NestedLessLess; with a semi-colon" do
+    input = "&NestedLessLess;"
+    output = [["Character", "≪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NewLine; with a semi-colon" do
+    input = "&NewLine;"
+    output = [["Character", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Nfr; with a semi-colon" do
+    input = "&Nfr;"
+    output = [["Character", "𝔑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NoBreak; with a semi-colon" do
+    input = "&NoBreak;"
+    output = [["Character", "⁠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NonBreakingSpace; with a semi-colon" do
+    input = "&NonBreakingSpace;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Nopf; with a semi-colon" do
+    input = "&Nopf;"
+    output = [["Character", "ℕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Not; with a semi-colon" do
+    input = "&Not;"
+    output = [["Character", "⫬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotCongruent; with a semi-colon" do
+    input = "&NotCongruent;"
+    output = [["Character", "≢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotCupCap; with a semi-colon" do
+    input = "&NotCupCap;"
+    output = [["Character", "≭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotDoubleVerticalBar; with a semi-colon" do
+    input = "&NotDoubleVerticalBar;"
+    output = [["Character", "∦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotElement; with a semi-colon" do
+    input = "&NotElement;"
+    output = [["Character", "∉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotEqual; with a semi-colon" do
+    input = "&NotEqual;"
+    output = [["Character", "≠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotEqualTilde; with a semi-colon" do
+    input = "&NotEqualTilde;"
+    output = [["Character", "≂̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotExists; with a semi-colon" do
+    input = "&NotExists;"
+    output = [["Character", "∄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreater; with a semi-colon" do
+    input = "&NotGreater;"
+    output = [["Character", "≯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreaterEqual; with a semi-colon" do
+    input = "&NotGreaterEqual;"
+    output = [["Character", "≱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreaterFullEqual; with a semi-colon" do
+    input = "&NotGreaterFullEqual;"
+    output = [["Character", "≧̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreaterGreater; with a semi-colon" do
+    input = "&NotGreaterGreater;"
+    output = [["Character", "≫̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreaterLess; with a semi-colon" do
+    input = "&NotGreaterLess;"
+    output = [["Character", "≹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreaterSlantEqual; with a semi-colon" do
+    input = "&NotGreaterSlantEqual;"
+    output = [["Character", "⩾̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotGreaterTilde; with a semi-colon" do
+    input = "&NotGreaterTilde;"
+    output = [["Character", "≵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotHumpDownHump; with a semi-colon" do
+    input = "&NotHumpDownHump;"
+    output = [["Character", "≎̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotHumpEqual; with a semi-colon" do
+    input = "&NotHumpEqual;"
+    output = [["Character", "≏̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLeftTriangle; with a semi-colon" do
+    input = "&NotLeftTriangle;"
+    output = [["Character", "⋪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLeftTriangleBar; with a semi-colon" do
+    input = "&NotLeftTriangleBar;"
+    output = [["Character", "⧏̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLeftTriangleEqual; with a semi-colon" do
+    input = "&NotLeftTriangleEqual;"
+    output = [["Character", "⋬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLess; with a semi-colon" do
+    input = "&NotLess;"
+    output = [["Character", "≮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLessEqual; with a semi-colon" do
+    input = "&NotLessEqual;"
+    output = [["Character", "≰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLessGreater; with a semi-colon" do
+    input = "&NotLessGreater;"
+    output = [["Character", "≸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLessLess; with a semi-colon" do
+    input = "&NotLessLess;"
+    output = [["Character", "≪̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLessSlantEqual; with a semi-colon" do
+    input = "&NotLessSlantEqual;"
+    output = [["Character", "⩽̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotLessTilde; with a semi-colon" do
+    input = "&NotLessTilde;"
+    output = [["Character", "≴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotNestedGreaterGreater; with a semi-colon" do
+    input = "&NotNestedGreaterGreater;"
+    output = [["Character", "⪢̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotNestedLessLess; with a semi-colon" do
+    input = "&NotNestedLessLess;"
+    output = [["Character", "⪡̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotPrecedes; with a semi-colon" do
+    input = "&NotPrecedes;"
+    output = [["Character", "⊀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotPrecedesEqual; with a semi-colon" do
+    input = "&NotPrecedesEqual;"
+    output = [["Character", "⪯̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotPrecedesSlantEqual; with a semi-colon" do
+    input = "&NotPrecedesSlantEqual;"
+    output = [["Character", "⋠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotReverseElement; with a semi-colon" do
+    input = "&NotReverseElement;"
+    output = [["Character", "∌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotRightTriangle; with a semi-colon" do
+    input = "&NotRightTriangle;"
+    output = [["Character", "⋫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotRightTriangleBar; with a semi-colon" do
+    input = "&NotRightTriangleBar;"
+    output = [["Character", "⧐̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotRightTriangleEqual; with a semi-colon" do
+    input = "&NotRightTriangleEqual;"
+    output = [["Character", "⋭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSquareSubset; with a semi-colon" do
+    input = "&NotSquareSubset;"
+    output = [["Character", "⊏̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSquareSubsetEqual; with a semi-colon" do
+    input = "&NotSquareSubsetEqual;"
+    output = [["Character", "⋢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSquareSuperset; with a semi-colon" do
+    input = "&NotSquareSuperset;"
+    output = [["Character", "⊐̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSquareSupersetEqual; with a semi-colon" do
+    input = "&NotSquareSupersetEqual;"
+    output = [["Character", "⋣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSubset; with a semi-colon" do
+    input = "&NotSubset;"
+    output = [["Character", "⊂⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSubsetEqual; with a semi-colon" do
+    input = "&NotSubsetEqual;"
+    output = [["Character", "⊈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSucceeds; with a semi-colon" do
+    input = "&NotSucceeds;"
+    output = [["Character", "⊁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSucceedsEqual; with a semi-colon" do
+    input = "&NotSucceedsEqual;"
+    output = [["Character", "⪰̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSucceedsSlantEqual; with a semi-colon" do
+    input = "&NotSucceedsSlantEqual;"
+    output = [["Character", "⋡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSucceedsTilde; with a semi-colon" do
+    input = "&NotSucceedsTilde;"
+    output = [["Character", "≿̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSuperset; with a semi-colon" do
+    input = "&NotSuperset;"
+    output = [["Character", "⊃⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotSupersetEqual; with a semi-colon" do
+    input = "&NotSupersetEqual;"
+    output = [["Character", "⊉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotTilde; with a semi-colon" do
+    input = "&NotTilde;"
+    output = [["Character", "≁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotTildeEqual; with a semi-colon" do
+    input = "&NotTildeEqual;"
+    output = [["Character", "≄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotTildeFullEqual; with a semi-colon" do
+    input = "&NotTildeFullEqual;"
+    output = [["Character", "≇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotTildeTilde; with a semi-colon" do
+    input = "&NotTildeTilde;"
+    output = [["Character", "≉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: NotVerticalBar; with a semi-colon" do
+    input = "&NotVerticalBar;"
+    output = [["Character", "∤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Nscr; with a semi-colon" do
+    input = "&Nscr;"
+    output = [["Character", "𝒩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ntilde without a semi-colon" do
+    input = "&Ntilde"
+    output = [["Character", "Ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ntilde; with a semi-colon" do
+    input = "&Ntilde;"
+    output = [["Character", "Ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Nu; with a semi-colon" do
+    input = "&Nu;"
+    output = [["Character", "Ν"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OElig; with a semi-colon" do
+    input = "&OElig;"
+    output = [["Character", "Œ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Oacute without a semi-colon" do
+    input = "&Oacute"
+    output = [["Character", "Ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Oacute; with a semi-colon" do
+    input = "&Oacute;"
+    output = [["Character", "Ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ocirc without a semi-colon" do
+    input = "&Ocirc"
+    output = [["Character", "Ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ocirc; with a semi-colon" do
+    input = "&Ocirc;"
+    output = [["Character", "Ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ocy; with a semi-colon" do
+    input = "&Ocy;"
+    output = [["Character", "О"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Odblac; with a semi-colon" do
+    input = "&Odblac;"
+    output = [["Character", "Ő"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ofr; with a semi-colon" do
+    input = "&Ofr;"
+    output = [["Character", "𝔒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ograve without a semi-colon" do
+    input = "&Ograve"
+    output = [["Character", "Ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ograve; with a semi-colon" do
+    input = "&Ograve;"
+    output = [["Character", "Ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Omacr; with a semi-colon" do
+    input = "&Omacr;"
+    output = [["Character", "Ō"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Omega; with a semi-colon" do
+    input = "&Omega;"
+    output = [["Character", "Ω"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Omicron; with a semi-colon" do
+    input = "&Omicron;"
+    output = [["Character", "Ο"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Oopf; with a semi-colon" do
+    input = "&Oopf;"
+    output = [["Character", "𝕆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OpenCurlyDoubleQuote; with a semi-colon" do
+    input = "&OpenCurlyDoubleQuote;"
+    output = [["Character", "“"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OpenCurlyQuote; with a semi-colon" do
+    input = "&OpenCurlyQuote;"
+    output = [["Character", "‘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Or; with a semi-colon" do
+    input = "&Or;"
+    output = [["Character", "⩔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Oscr; with a semi-colon" do
+    input = "&Oscr;"
+    output = [["Character", "𝒪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Oslash without a semi-colon" do
+    input = "&Oslash"
+    output = [["Character", "Ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Oslash; with a semi-colon" do
+    input = "&Oslash;"
+    output = [["Character", "Ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Otilde without a semi-colon" do
+    input = "&Otilde"
+    output = [["Character", "Õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Otilde; with a semi-colon" do
+    input = "&Otilde;"
+    output = [["Character", "Õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Otimes; with a semi-colon" do
+    input = "&Otimes;"
+    output = [["Character", "⨷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ouml without a semi-colon" do
+    input = "&Ouml"
+    output = [["Character", "Ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ouml; with a semi-colon" do
+    input = "&Ouml;"
+    output = [["Character", "Ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OverBar; with a semi-colon" do
+    input = "&OverBar;"
+    output = [["Character", "‾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OverBrace; with a semi-colon" do
+    input = "&OverBrace;"
+    output = [["Character", "⏞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OverBracket; with a semi-colon" do
+    input = "&OverBracket;"
+    output = [["Character", "⎴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: OverParenthesis; with a semi-colon" do
+    input = "&OverParenthesis;"
+    output = [["Character", "⏜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: PartialD; with a semi-colon" do
+    input = "&PartialD;"
+    output = [["Character", "∂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Pcy; with a semi-colon" do
+    input = "&Pcy;"
+    output = [["Character", "П"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Pfr; with a semi-colon" do
+    input = "&Pfr;"
+    output = [["Character", "𝔓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Phi; with a semi-colon" do
+    input = "&Phi;"
+    output = [["Character", "Φ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Pi; with a semi-colon" do
+    input = "&Pi;"
+    output = [["Character", "Π"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: PlusMinus; with a semi-colon" do
+    input = "&PlusMinus;"
+    output = [["Character", "±"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part25_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part25_test.exs
new file mode 100644
index 00000000..32a2cae0
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part25_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart25Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: Poincareplane; with a semi-colon" do
+    input = "&Poincareplane;"
+    output = [["Character", "ℌ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Popf; with a semi-colon" do
+    input = "&Popf;"
+    output = [["Character", "ℙ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Pr; with a semi-colon" do
+    input = "&Pr;"
+    output = [["Character", "⪻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Precedes; with a semi-colon" do
+    input = "&Precedes;"
+    output = [["Character", "≺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: PrecedesEqual; with a semi-colon" do
+    input = "&PrecedesEqual;"
+    output = [["Character", "⪯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: PrecedesSlantEqual; with a semi-colon" do
+    input = "&PrecedesSlantEqual;"
+    output = [["Character", "≼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: PrecedesTilde; with a semi-colon" do
+    input = "&PrecedesTilde;"
+    output = [["Character", "≾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Prime; with a semi-colon" do
+    input = "&Prime;"
+    output = [["Character", "″"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Product; with a semi-colon" do
+    input = "&Product;"
+    output = [["Character", "∏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Proportion; with a semi-colon" do
+    input = "&Proportion;"
+    output = [["Character", "∷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Proportional; with a semi-colon" do
+    input = "&Proportional;"
+    output = [["Character", "∝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Pscr; with a semi-colon" do
+    input = "&Pscr;"
+    output = [["Character", "𝒫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Psi; with a semi-colon" do
+    input = "&Psi;"
+    output = [["Character", "Ψ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: QUOT without a semi-colon" do
+    input = "&QUOT"
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: QUOT; with a semi-colon" do
+    input = "&QUOT;"
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Qfr; with a semi-colon" do
+    input = "&Qfr;"
+    output = [["Character", "𝔔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Qopf; with a semi-colon" do
+    input = "&Qopf;"
+    output = [["Character", "ℚ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Qscr; with a semi-colon" do
+    input = "&Qscr;"
+    output = [["Character", "𝒬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RBarr; with a semi-colon" do
+    input = "&RBarr;"
+    output = [["Character", "⤐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: REG without a semi-colon" do
+    input = "&REG"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: REG; with a semi-colon" do
+    input = "&REG;"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Racute; with a semi-colon" do
+    input = "&Racute;"
+    output = [["Character", "Ŕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rang; with a semi-colon" do
+    input = "&Rang;"
+    output = [["Character", "⟫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rarr; with a semi-colon" do
+    input = "&Rarr;"
+    output = [["Character", "↠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rarrtl; with a semi-colon" do
+    input = "&Rarrtl;"
+    output = [["Character", "⤖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rcaron; with a semi-colon" do
+    input = "&Rcaron;"
+    output = [["Character", "Ř"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rcedil; with a semi-colon" do
+    input = "&Rcedil;"
+    output = [["Character", "Ŗ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rcy; with a semi-colon" do
+    input = "&Rcy;"
+    output = [["Character", "Р"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Re; with a semi-colon" do
+    input = "&Re;"
+    output = [["Character", "ℜ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ReverseElement; with a semi-colon" do
+    input = "&ReverseElement;"
+    output = [["Character", "∋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ReverseEquilibrium; with a semi-colon" do
+    input = "&ReverseEquilibrium;"
+    output = [["Character", "⇋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ReverseUpEquilibrium; with a semi-colon" do
+    input = "&ReverseUpEquilibrium;"
+    output = [["Character", "⥯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rfr; with a semi-colon" do
+    input = "&Rfr;"
+    output = [["Character", "ℜ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rho; with a semi-colon" do
+    input = "&Rho;"
+    output = [["Character", "Ρ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightAngleBracket; with a semi-colon" do
+    input = "&RightAngleBracket;"
+    output = [["Character", "⟩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightArrow; with a semi-colon" do
+    input = "&RightArrow;"
+    output = [["Character", "→"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightArrowBar; with a semi-colon" do
+    input = "&RightArrowBar;"
+    output = [["Character", "⇥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightArrowLeftArrow; with a semi-colon" do
+    input = "&RightArrowLeftArrow;"
+    output = [["Character", "⇄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightCeiling; with a semi-colon" do
+    input = "&RightCeiling;"
+    output = [["Character", "⌉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightDoubleBracket; with a semi-colon" do
+    input = "&RightDoubleBracket;"
+    output = [["Character", "⟧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightDownTeeVector; with a semi-colon" do
+    input = "&RightDownTeeVector;"
+    output = [["Character", "⥝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightDownVector; with a semi-colon" do
+    input = "&RightDownVector;"
+    output = [["Character", "⇂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightDownVectorBar; with a semi-colon" do
+    input = "&RightDownVectorBar;"
+    output = [["Character", "⥕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightFloor; with a semi-colon" do
+    input = "&RightFloor;"
+    output = [["Character", "⌋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightTee; with a semi-colon" do
+    input = "&RightTee;"
+    output = [["Character", "⊢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightTeeArrow; with a semi-colon" do
+    input = "&RightTeeArrow;"
+    output = [["Character", "↦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightTeeVector; with a semi-colon" do
+    input = "&RightTeeVector;"
+    output = [["Character", "⥛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightTriangle; with a semi-colon" do
+    input = "&RightTriangle;"
+    output = [["Character", "⊳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightTriangleBar; with a semi-colon" do
+    input = "&RightTriangleBar;"
+    output = [["Character", "⧐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightTriangleEqual; with a semi-colon" do
+    input = "&RightTriangleEqual;"
+    output = [["Character", "⊵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightUpDownVector; with a semi-colon" do
+    input = "&RightUpDownVector;"
+    output = [["Character", "⥏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightUpTeeVector; with a semi-colon" do
+    input = "&RightUpTeeVector;"
+    output = [["Character", "⥜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightUpVector; with a semi-colon" do
+    input = "&RightUpVector;"
+    output = [["Character", "↾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightUpVectorBar; with a semi-colon" do
+    input = "&RightUpVectorBar;"
+    output = [["Character", "⥔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightVector; with a semi-colon" do
+    input = "&RightVector;"
+    output = [["Character", "⇀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RightVectorBar; with a semi-colon" do
+    input = "&RightVectorBar;"
+    output = [["Character", "⥓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rightarrow; with a semi-colon" do
+    input = "&Rightarrow;"
+    output = [["Character", "⇒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ropf; with a semi-colon" do
+    input = "&Ropf;"
+    output = [["Character", "ℝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RoundImplies; with a semi-colon" do
+    input = "&RoundImplies;"
+    output = [["Character", "⥰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rrightarrow; with a semi-colon" do
+    input = "&Rrightarrow;"
+    output = [["Character", "⇛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rscr; with a semi-colon" do
+    input = "&Rscr;"
+    output = [["Character", "ℛ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Rsh; with a semi-colon" do
+    input = "&Rsh;"
+    output = [["Character", "↱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: RuleDelayed; with a semi-colon" do
+    input = "&RuleDelayed;"
+    output = [["Character", "⧴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SHCHcy; with a semi-colon" do
+    input = "&SHCHcy;"
+    output = [["Character", "Щ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SHcy; with a semi-colon" do
+    input = "&SHcy;"
+    output = [["Character", "Ш"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SOFTcy; with a semi-colon" do
+    input = "&SOFTcy;"
+    output = [["Character", "Ь"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sacute; with a semi-colon" do
+    input = "&Sacute;"
+    output = [["Character", "Ś"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sc; with a semi-colon" do
+    input = "&Sc;"
+    output = [["Character", "⪼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Scaron; with a semi-colon" do
+    input = "&Scaron;"
+    output = [["Character", "Š"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Scedil; with a semi-colon" do
+    input = "&Scedil;"
+    output = [["Character", "Ş"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Scirc; with a semi-colon" do
+    input = "&Scirc;"
+    output = [["Character", "Ŝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Scy; with a semi-colon" do
+    input = "&Scy;"
+    output = [["Character", "С"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sfr; with a semi-colon" do
+    input = "&Sfr;"
+    output = [["Character", "𝔖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ShortDownArrow; with a semi-colon" do
+    input = "&ShortDownArrow;"
+    output = [["Character", "↓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ShortLeftArrow; with a semi-colon" do
+    input = "&ShortLeftArrow;"
+    output = [["Character", "←"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ShortRightArrow; with a semi-colon" do
+    input = "&ShortRightArrow;"
+    output = [["Character", "→"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ShortUpArrow; with a semi-colon" do
+    input = "&ShortUpArrow;"
+    output = [["Character", "↑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sigma; with a semi-colon" do
+    input = "&Sigma;"
+    output = [["Character", "Σ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SmallCircle; with a semi-colon" do
+    input = "&SmallCircle;"
+    output = [["Character", "∘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sopf; with a semi-colon" do
+    input = "&Sopf;"
+    output = [["Character", "𝕊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sqrt; with a semi-colon" do
+    input = "&Sqrt;"
+    output = [["Character", "√"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Square; with a semi-colon" do
+    input = "&Square;"
+    output = [["Character", "□"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SquareIntersection; with a semi-colon" do
+    input = "&SquareIntersection;"
+    output = [["Character", "⊓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SquareSubset; with a semi-colon" do
+    input = "&SquareSubset;"
+    output = [["Character", "⊏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SquareSubsetEqual; with a semi-colon" do
+    input = "&SquareSubsetEqual;"
+    output = [["Character", "⊑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SquareSuperset; with a semi-colon" do
+    input = "&SquareSuperset;"
+    output = [["Character", "⊐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SquareSupersetEqual; with a semi-colon" do
+    input = "&SquareSupersetEqual;"
+    output = [["Character", "⊒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SquareUnion; with a semi-colon" do
+    input = "&SquareUnion;"
+    output = [["Character", "⊔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sscr; with a semi-colon" do
+    input = "&Sscr;"
+    output = [["Character", "𝒮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Star; with a semi-colon" do
+    input = "&Star;"
+    output = [["Character", "⋆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sub; with a semi-colon" do
+    input = "&Sub;"
+    output = [["Character", "⋐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Subset; with a semi-colon" do
+    input = "&Subset;"
+    output = [["Character", "⋐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SubsetEqual; with a semi-colon" do
+    input = "&SubsetEqual;"
+    output = [["Character", "⊆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Succeeds; with a semi-colon" do
+    input = "&Succeeds;"
+    output = [["Character", "≻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SucceedsEqual; with a semi-colon" do
+    input = "&SucceedsEqual;"
+    output = [["Character", "⪰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SucceedsSlantEqual; with a semi-colon" do
+    input = "&SucceedsSlantEqual;"
+    output = [["Character", "≽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SucceedsTilde; with a semi-colon" do
+    input = "&SucceedsTilde;"
+    output = [["Character", "≿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SuchThat; with a semi-colon" do
+    input = "&SuchThat;"
+    output = [["Character", "∋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sum; with a semi-colon" do
+    input = "&Sum;"
+    output = [["Character", "∑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Sup; with a semi-colon" do
+    input = "&Sup;"
+    output = [["Character", "⋑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part26_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part26_test.exs
new file mode 100644
index 00000000..2fe01647
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part26_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart26Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: Superset; with a semi-colon" do
+    input = "&Superset;"
+    output = [["Character", "⊃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: SupersetEqual; with a semi-colon" do
+    input = "&SupersetEqual;"
+    output = [["Character", "⊇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Supset; with a semi-colon" do
+    input = "&Supset;"
+    output = [["Character", "⋑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: THORN without a semi-colon" do
+    input = "&THORN"
+    output = [["Character", "Þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: THORN; with a semi-colon" do
+    input = "&THORN;"
+    output = [["Character", "Þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TRADE; with a semi-colon" do
+    input = "&TRADE;"
+    output = [["Character", "™"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TSHcy; with a semi-colon" do
+    input = "&TSHcy;"
+    output = [["Character", "Ћ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TScy; with a semi-colon" do
+    input = "&TScy;"
+    output = [["Character", "Ц"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tab; with a semi-colon" do
+    input = "&Tab;"
+    output = [["Character", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tau; with a semi-colon" do
+    input = "&Tau;"
+    output = [["Character", "Τ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tcaron; with a semi-colon" do
+    input = "&Tcaron;"
+    output = [["Character", "Ť"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tcedil; with a semi-colon" do
+    input = "&Tcedil;"
+    output = [["Character", "Ţ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tcy; with a semi-colon" do
+    input = "&Tcy;"
+    output = [["Character", "Т"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tfr; with a semi-colon" do
+    input = "&Tfr;"
+    output = [["Character", "𝔗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Therefore; with a semi-colon" do
+    input = "&Therefore;"
+    output = [["Character", "∴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Theta; with a semi-colon" do
+    input = "&Theta;"
+    output = [["Character", "Θ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ThickSpace; with a semi-colon" do
+    input = "&ThickSpace;"
+    output = [["Character", "  "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ThinSpace; with a semi-colon" do
+    input = "&ThinSpace;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tilde; with a semi-colon" do
+    input = "&Tilde;"
+    output = [["Character", "∼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TildeEqual; with a semi-colon" do
+    input = "&TildeEqual;"
+    output = [["Character", "≃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TildeFullEqual; with a semi-colon" do
+    input = "&TildeFullEqual;"
+    output = [["Character", "≅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TildeTilde; with a semi-colon" do
+    input = "&TildeTilde;"
+    output = [["Character", "≈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Topf; with a semi-colon" do
+    input = "&Topf;"
+    output = [["Character", "𝕋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: TripleDot; with a semi-colon" do
+    input = "&TripleDot;"
+    output = [["Character", "⃛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tscr; with a semi-colon" do
+    input = "&Tscr;"
+    output = [["Character", "𝒯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Tstrok; with a semi-colon" do
+    input = "&Tstrok;"
+    output = [["Character", "Ŧ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uacute without a semi-colon" do
+    input = "&Uacute"
+    output = [["Character", "Ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uacute; with a semi-colon" do
+    input = "&Uacute;"
+    output = [["Character", "Ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uarr; with a semi-colon" do
+    input = "&Uarr;"
+    output = [["Character", "↟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uarrocir; with a semi-colon" do
+    input = "&Uarrocir;"
+    output = [["Character", "⥉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ubrcy; with a semi-colon" do
+    input = "&Ubrcy;"
+    output = [["Character", "Ў"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ubreve; with a semi-colon" do
+    input = "&Ubreve;"
+    output = [["Character", "Ŭ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ucirc without a semi-colon" do
+    input = "&Ucirc"
+    output = [["Character", "Û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ucirc; with a semi-colon" do
+    input = "&Ucirc;"
+    output = [["Character", "Û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ucy; with a semi-colon" do
+    input = "&Ucy;"
+    output = [["Character", "У"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Udblac; with a semi-colon" do
+    input = "&Udblac;"
+    output = [["Character", "Ű"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ufr; with a semi-colon" do
+    input = "&Ufr;"
+    output = [["Character", "𝔘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ugrave without a semi-colon" do
+    input = "&Ugrave"
+    output = [["Character", "Ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ugrave; with a semi-colon" do
+    input = "&Ugrave;"
+    output = [["Character", "Ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Umacr; with a semi-colon" do
+    input = "&Umacr;"
+    output = [["Character", "Ū"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UnderBar; with a semi-colon" do
+    input = "&UnderBar;"
+    output = [["Character", "_"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UnderBrace; with a semi-colon" do
+    input = "&UnderBrace;"
+    output = [["Character", "⏟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UnderBracket; with a semi-colon" do
+    input = "&UnderBracket;"
+    output = [["Character", "⎵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UnderParenthesis; with a semi-colon" do
+    input = "&UnderParenthesis;"
+    output = [["Character", "⏝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Union; with a semi-colon" do
+    input = "&Union;"
+    output = [["Character", "⋃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UnionPlus; with a semi-colon" do
+    input = "&UnionPlus;"
+    output = [["Character", "⊎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uogon; with a semi-colon" do
+    input = "&Uogon;"
+    output = [["Character", "Ų"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uopf; with a semi-colon" do
+    input = "&Uopf;"
+    output = [["Character", "𝕌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpArrow; with a semi-colon" do
+    input = "&UpArrow;"
+    output = [["Character", "↑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpArrowBar; with a semi-colon" do
+    input = "&UpArrowBar;"
+    output = [["Character", "⤒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpArrowDownArrow; with a semi-colon" do
+    input = "&UpArrowDownArrow;"
+    output = [["Character", "⇅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpDownArrow; with a semi-colon" do
+    input = "&UpDownArrow;"
+    output = [["Character", "↕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpEquilibrium; with a semi-colon" do
+    input = "&UpEquilibrium;"
+    output = [["Character", "⥮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpTee; with a semi-colon" do
+    input = "&UpTee;"
+    output = [["Character", "⊥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpTeeArrow; with a semi-colon" do
+    input = "&UpTeeArrow;"
+    output = [["Character", "↥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uparrow; with a semi-colon" do
+    input = "&Uparrow;"
+    output = [["Character", "⇑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Updownarrow; with a semi-colon" do
+    input = "&Updownarrow;"
+    output = [["Character", "⇕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpperLeftArrow; with a semi-colon" do
+    input = "&UpperLeftArrow;"
+    output = [["Character", "↖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: UpperRightArrow; with a semi-colon" do
+    input = "&UpperRightArrow;"
+    output = [["Character", "↗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Upsi; with a semi-colon" do
+    input = "&Upsi;"
+    output = [["Character", "ϒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Upsilon; with a semi-colon" do
+    input = "&Upsilon;"
+    output = [["Character", "Υ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uring; with a semi-colon" do
+    input = "&Uring;"
+    output = [["Character", "Ů"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uscr; with a semi-colon" do
+    input = "&Uscr;"
+    output = [["Character", "𝒰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Utilde; with a semi-colon" do
+    input = "&Utilde;"
+    output = [["Character", "Ũ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uuml without a semi-colon" do
+    input = "&Uuml"
+    output = [["Character", "Ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Uuml; with a semi-colon" do
+    input = "&Uuml;"
+    output = [["Character", "Ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: VDash; with a semi-colon" do
+    input = "&VDash;"
+    output = [["Character", "⊫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vbar; with a semi-colon" do
+    input = "&Vbar;"
+    output = [["Character", "⫫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vcy; with a semi-colon" do
+    input = "&Vcy;"
+    output = [["Character", "В"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vdash; with a semi-colon" do
+    input = "&Vdash;"
+    output = [["Character", "⊩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vdashl; with a semi-colon" do
+    input = "&Vdashl;"
+    output = [["Character", "⫦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vee; with a semi-colon" do
+    input = "&Vee;"
+    output = [["Character", "⋁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Verbar; with a semi-colon" do
+    input = "&Verbar;"
+    output = [["Character", "‖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vert; with a semi-colon" do
+    input = "&Vert;"
+    output = [["Character", "‖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: VerticalBar; with a semi-colon" do
+    input = "&VerticalBar;"
+    output = [["Character", "∣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: VerticalLine; with a semi-colon" do
+    input = "&VerticalLine;"
+    output = [["Character", "|"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: VerticalSeparator; with a semi-colon" do
+    input = "&VerticalSeparator;"
+    output = [["Character", "❘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: VerticalTilde; with a semi-colon" do
+    input = "&VerticalTilde;"
+    output = [["Character", "≀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: VeryThinSpace; with a semi-colon" do
+    input = "&VeryThinSpace;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vfr; with a semi-colon" do
+    input = "&Vfr;"
+    output = [["Character", "𝔙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vopf; with a semi-colon" do
+    input = "&Vopf;"
+    output = [["Character", "𝕍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vscr; with a semi-colon" do
+    input = "&Vscr;"
+    output = [["Character", "𝒱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Vvdash; with a semi-colon" do
+    input = "&Vvdash;"
+    output = [["Character", "⊪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Wcirc; with a semi-colon" do
+    input = "&Wcirc;"
+    output = [["Character", "Ŵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Wedge; with a semi-colon" do
+    input = "&Wedge;"
+    output = [["Character", "⋀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Wfr; with a semi-colon" do
+    input = "&Wfr;"
+    output = [["Character", "𝔚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Wopf; with a semi-colon" do
+    input = "&Wopf;"
+    output = [["Character", "𝕎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Wscr; with a semi-colon" do
+    input = "&Wscr;"
+    output = [["Character", "𝒲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Xfr; with a semi-colon" do
+    input = "&Xfr;"
+    output = [["Character", "𝔛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Xi; with a semi-colon" do
+    input = "&Xi;"
+    output = [["Character", "Ξ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Xopf; with a semi-colon" do
+    input = "&Xopf;"
+    output = [["Character", "𝕏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Xscr; with a semi-colon" do
+    input = "&Xscr;"
+    output = [["Character", "𝒳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: YAcy; with a semi-colon" do
+    input = "&YAcy;"
+    output = [["Character", "Я"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: YIcy; with a semi-colon" do
+    input = "&YIcy;"
+    output = [["Character", "Ї"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: YUcy; with a semi-colon" do
+    input = "&YUcy;"
+    output = [["Character", "Ю"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Yacute without a semi-colon" do
+    input = "&Yacute"
+    output = [["Character", "Ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Yacute; with a semi-colon" do
+    input = "&Yacute;"
+    output = [["Character", "Ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ycirc; with a semi-colon" do
+    input = "&Ycirc;"
+    output = [["Character", "Ŷ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Ycy; with a semi-colon" do
+    input = "&Ycy;"
+    output = [["Character", "Ы"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Yfr; with a semi-colon" do
+    input = "&Yfr;"
+    output = [["Character", "𝔜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part27_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part27_test.exs
new file mode 100644
index 00000000..7d05573e
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part27_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart27Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: Yopf; with a semi-colon" do
+    input = "&Yopf;"
+    output = [["Character", "𝕐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Yscr; with a semi-colon" do
+    input = "&Yscr;"
+    output = [["Character", "𝒴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Yuml; with a semi-colon" do
+    input = "&Yuml;"
+    output = [["Character", "Ÿ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ZHcy; with a semi-colon" do
+    input = "&ZHcy;"
+    output = [["Character", "Ж"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zacute; with a semi-colon" do
+    input = "&Zacute;"
+    output = [["Character", "Ź"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zcaron; with a semi-colon" do
+    input = "&Zcaron;"
+    output = [["Character", "Ž"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zcy; with a semi-colon" do
+    input = "&Zcy;"
+    output = [["Character", "З"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zdot; with a semi-colon" do
+    input = "&Zdot;"
+    output = [["Character", "Ż"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ZeroWidthSpace; with a semi-colon" do
+    input = "&ZeroWidthSpace;"
+    output = [["Character", "​"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zeta; with a semi-colon" do
+    input = "&Zeta;"
+    output = [["Character", "Ζ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zfr; with a semi-colon" do
+    input = "&Zfr;"
+    output = [["Character", "ℨ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zopf; with a semi-colon" do
+    input = "&Zopf;"
+    output = [["Character", "ℤ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: Zscr; with a semi-colon" do
+    input = "&Zscr;"
+    output = [["Character", "𝒵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aacute without a semi-colon" do
+    input = "&aacute"
+    output = [["Character", "á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aacute; with a semi-colon" do
+    input = "&aacute;"
+    output = [["Character", "á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: abreve; with a semi-colon" do
+    input = "&abreve;"
+    output = [["Character", "ă"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ac; with a semi-colon" do
+    input = "&ac;"
+    output = [["Character", "∾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acE; with a semi-colon" do
+    input = "&acE;"
+    output = [["Character", "∾̳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acd; with a semi-colon" do
+    input = "&acd;"
+    output = [["Character", "∿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acirc without a semi-colon" do
+    input = "&acirc"
+    output = [["Character", "â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acirc; with a semi-colon" do
+    input = "&acirc;"
+    output = [["Character", "â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acute without a semi-colon" do
+    input = "&acute"
+    output = [["Character", "´"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acute; with a semi-colon" do
+    input = "&acute;"
+    output = [["Character", "´"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: acy; with a semi-colon" do
+    input = "&acy;"
+    output = [["Character", "а"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aelig without a semi-colon" do
+    input = "&aelig"
+    output = [["Character", "æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aelig; with a semi-colon" do
+    input = "&aelig;"
+    output = [["Character", "æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: af; with a semi-colon" do
+    input = "&af;"
+    output = [["Character", "⁡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: afr; with a semi-colon" do
+    input = "&afr;"
+    output = [["Character", "𝔞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: agrave without a semi-colon" do
+    input = "&agrave"
+    output = [["Character", "à"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: agrave; with a semi-colon" do
+    input = "&agrave;"
+    output = [["Character", "à"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: alefsym; with a semi-colon" do
+    input = "&alefsym;"
+    output = [["Character", "ℵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aleph; with a semi-colon" do
+    input = "&aleph;"
+    output = [["Character", "ℵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: alpha; with a semi-colon" do
+    input = "&alpha;"
+    output = [["Character", "α"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: amacr; with a semi-colon" do
+    input = "&amacr;"
+    output = [["Character", "ā"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: amalg; with a semi-colon" do
+    input = "&amalg;"
+    output = [["Character", "⨿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: amp without a semi-colon" do
+    input = "&amp"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: amp; with a semi-colon" do
+    input = "&amp;"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: and; with a semi-colon" do
+    input = "&and;"
+    output = [["Character", "∧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: andand; with a semi-colon" do
+    input = "&andand;"
+    output = [["Character", "⩕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: andd; with a semi-colon" do
+    input = "&andd;"
+    output = [["Character", "⩜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: andslope; with a semi-colon" do
+    input = "&andslope;"
+    output = [["Character", "⩘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: andv; with a semi-colon" do
+    input = "&andv;"
+    output = [["Character", "⩚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ang; with a semi-colon" do
+    input = "&ang;"
+    output = [["Character", "∠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ange; with a semi-colon" do
+    input = "&ange;"
+    output = [["Character", "⦤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angle; with a semi-colon" do
+    input = "&angle;"
+    output = [["Character", "∠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsd; with a semi-colon" do
+    input = "&angmsd;"
+    output = [["Character", "∡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdaa; with a semi-colon" do
+    input = "&angmsdaa;"
+    output = [["Character", "⦨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdab; with a semi-colon" do
+    input = "&angmsdab;"
+    output = [["Character", "⦩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdac; with a semi-colon" do
+    input = "&angmsdac;"
+    output = [["Character", "⦪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdad; with a semi-colon" do
+    input = "&angmsdad;"
+    output = [["Character", "⦫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdae; with a semi-colon" do
+    input = "&angmsdae;"
+    output = [["Character", "⦬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdaf; with a semi-colon" do
+    input = "&angmsdaf;"
+    output = [["Character", "⦭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdag; with a semi-colon" do
+    input = "&angmsdag;"
+    output = [["Character", "⦮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angmsdah; with a semi-colon" do
+    input = "&angmsdah;"
+    output = [["Character", "⦯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angrt; with a semi-colon" do
+    input = "&angrt;"
+    output = [["Character", "∟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angrtvb; with a semi-colon" do
+    input = "&angrtvb;"
+    output = [["Character", "⊾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angrtvbd; with a semi-colon" do
+    input = "&angrtvbd;"
+    output = [["Character", "⦝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angsph; with a semi-colon" do
+    input = "&angsph;"
+    output = [["Character", "∢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angst; with a semi-colon" do
+    input = "&angst;"
+    output = [["Character", "Å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: angzarr; with a semi-colon" do
+    input = "&angzarr;"
+    output = [["Character", "⍼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aogon; with a semi-colon" do
+    input = "&aogon;"
+    output = [["Character", "ą"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aopf; with a semi-colon" do
+    input = "&aopf;"
+    output = [["Character", "𝕒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ap; with a semi-colon" do
+    input = "&ap;"
+    output = [["Character", "≈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: apE; with a semi-colon" do
+    input = "&apE;"
+    output = [["Character", "⩰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: apacir; with a semi-colon" do
+    input = "&apacir;"
+    output = [["Character", "⩯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ape; with a semi-colon" do
+    input = "&ape;"
+    output = [["Character", "≊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: apid; with a semi-colon" do
+    input = "&apid;"
+    output = [["Character", "≋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: apos; with a semi-colon" do
+    input = "&apos;"
+    output = [["Character", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: approx; with a semi-colon" do
+    input = "&approx;"
+    output = [["Character", "≈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: approxeq; with a semi-colon" do
+    input = "&approxeq;"
+    output = [["Character", "≊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aring without a semi-colon" do
+    input = "&aring"
+    output = [["Character", "å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: aring; with a semi-colon" do
+    input = "&aring;"
+    output = [["Character", "å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ascr; with a semi-colon" do
+    input = "&ascr;"
+    output = [["Character", "𝒶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ast; with a semi-colon" do
+    input = "&ast;"
+    output = [["Character", "*"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: asymp; with a semi-colon" do
+    input = "&asymp;"
+    output = [["Character", "≈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: asympeq; with a semi-colon" do
+    input = "&asympeq;"
+    output = [["Character", "≍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: atilde without a semi-colon" do
+    input = "&atilde"
+    output = [["Character", "ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: atilde; with a semi-colon" do
+    input = "&atilde;"
+    output = [["Character", "ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: auml without a semi-colon" do
+    input = "&auml"
+    output = [["Character", "ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: auml; with a semi-colon" do
+    input = "&auml;"
+    output = [["Character", "ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: awconint; with a semi-colon" do
+    input = "&awconint;"
+    output = [["Character", "∳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: awint; with a semi-colon" do
+    input = "&awint;"
+    output = [["Character", "⨑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bNot; with a semi-colon" do
+    input = "&bNot;"
+    output = [["Character", "⫭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: backcong; with a semi-colon" do
+    input = "&backcong;"
+    output = [["Character", "≌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: backepsilon; with a semi-colon" do
+    input = "&backepsilon;"
+    output = [["Character", "϶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: backprime; with a semi-colon" do
+    input = "&backprime;"
+    output = [["Character", "‵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: backsim; with a semi-colon" do
+    input = "&backsim;"
+    output = [["Character", "∽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: backsimeq; with a semi-colon" do
+    input = "&backsimeq;"
+    output = [["Character", "⋍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: barvee; with a semi-colon" do
+    input = "&barvee;"
+    output = [["Character", "⊽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: barwed; with a semi-colon" do
+    input = "&barwed;"
+    output = [["Character", "⌅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: barwedge; with a semi-colon" do
+    input = "&barwedge;"
+    output = [["Character", "⌅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bbrk; with a semi-colon" do
+    input = "&bbrk;"
+    output = [["Character", "⎵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bbrktbrk; with a semi-colon" do
+    input = "&bbrktbrk;"
+    output = [["Character", "⎶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bcong; with a semi-colon" do
+    input = "&bcong;"
+    output = [["Character", "≌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bcy; with a semi-colon" do
+    input = "&bcy;"
+    output = [["Character", "б"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bdquo; with a semi-colon" do
+    input = "&bdquo;"
+    output = [["Character", "„"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: becaus; with a semi-colon" do
+    input = "&becaus;"
+    output = [["Character", "∵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: because; with a semi-colon" do
+    input = "&because;"
+    output = [["Character", "∵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bemptyv; with a semi-colon" do
+    input = "&bemptyv;"
+    output = [["Character", "⦰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bepsi; with a semi-colon" do
+    input = "&bepsi;"
+    output = [["Character", "϶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part28_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part28_test.exs
new file mode 100644
index 00000000..f3fc9631
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part28_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart28Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: bernou; with a semi-colon" do
+    input = "&bernou;"
+    output = [["Character", "ℬ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: beta; with a semi-colon" do
+    input = "&beta;"
+    output = [["Character", "β"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: beth; with a semi-colon" do
+    input = "&beth;"
+    output = [["Character", "ℶ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: between; with a semi-colon" do
+    input = "&between;"
+    output = [["Character", "≬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bfr; with a semi-colon" do
+    input = "&bfr;"
+    output = [["Character", "𝔟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigcap; with a semi-colon" do
+    input = "&bigcap;"
+    output = [["Character", "⋂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigcirc; with a semi-colon" do
+    input = "&bigcirc;"
+    output = [["Character", "◯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigcup; with a semi-colon" do
+    input = "&bigcup;"
+    output = [["Character", "⋃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigodot; with a semi-colon" do
+    input = "&bigodot;"
+    output = [["Character", "⨀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigoplus; with a semi-colon" do
+    input = "&bigoplus;"
+    output = [["Character", "⨁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigotimes; with a semi-colon" do
+    input = "&bigotimes;"
+    output = [["Character", "⨂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigsqcup; with a semi-colon" do
+    input = "&bigsqcup;"
+    output = [["Character", "⨆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigstar; with a semi-colon" do
+    input = "&bigstar;"
+    output = [["Character", "★"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigtriangledown; with a semi-colon" do
+    input = "&bigtriangledown;"
+    output = [["Character", "▽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigtriangleup; with a semi-colon" do
+    input = "&bigtriangleup;"
+    output = [["Character", "△"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: biguplus; with a semi-colon" do
+    input = "&biguplus;"
+    output = [["Character", "⨄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigvee; with a semi-colon" do
+    input = "&bigvee;"
+    output = [["Character", "⋁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bigwedge; with a semi-colon" do
+    input = "&bigwedge;"
+    output = [["Character", "⋀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bkarow; with a semi-colon" do
+    input = "&bkarow;"
+    output = [["Character", "⤍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blacklozenge; with a semi-colon" do
+    input = "&blacklozenge;"
+    output = [["Character", "⧫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blacksquare; with a semi-colon" do
+    input = "&blacksquare;"
+    output = [["Character", "▪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blacktriangle; with a semi-colon" do
+    input = "&blacktriangle;"
+    output = [["Character", "▴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blacktriangledown; with a semi-colon" do
+    input = "&blacktriangledown;"
+    output = [["Character", "▾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blacktriangleleft; with a semi-colon" do
+    input = "&blacktriangleleft;"
+    output = [["Character", "◂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blacktriangleright; with a semi-colon" do
+    input = "&blacktriangleright;"
+    output = [["Character", "▸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blank; with a semi-colon" do
+    input = "&blank;"
+    output = [["Character", "␣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blk12; with a semi-colon" do
+    input = "&blk12;"
+    output = [["Character", "▒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blk14; with a semi-colon" do
+    input = "&blk14;"
+    output = [["Character", "░"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: blk34; with a semi-colon" do
+    input = "&blk34;"
+    output = [["Character", "▓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: block; with a semi-colon" do
+    input = "&block;"
+    output = [["Character", "█"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bne; with a semi-colon" do
+    input = "&bne;"
+    output = [["Character", "=⃥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bnequiv; with a semi-colon" do
+    input = "&bnequiv;"
+    output = [["Character", "≡⃥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bnot; with a semi-colon" do
+    input = "&bnot;"
+    output = [["Character", "⌐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bopf; with a semi-colon" do
+    input = "&bopf;"
+    output = [["Character", "𝕓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bot; with a semi-colon" do
+    input = "&bot;"
+    output = [["Character", "⊥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bottom; with a semi-colon" do
+    input = "&bottom;"
+    output = [["Character", "⊥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bowtie; with a semi-colon" do
+    input = "&bowtie;"
+    output = [["Character", "⋈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxDL; with a semi-colon" do
+    input = "&boxDL;"
+    output = [["Character", "╗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxDR; with a semi-colon" do
+    input = "&boxDR;"
+    output = [["Character", "╔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxDl; with a semi-colon" do
+    input = "&boxDl;"
+    output = [["Character", "╖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxDr; with a semi-colon" do
+    input = "&boxDr;"
+    output = [["Character", "╓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxH; with a semi-colon" do
+    input = "&boxH;"
+    output = [["Character", "═"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxHD; with a semi-colon" do
+    input = "&boxHD;"
+    output = [["Character", "╦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxHU; with a semi-colon" do
+    input = "&boxHU;"
+    output = [["Character", "╩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxHd; with a semi-colon" do
+    input = "&boxHd;"
+    output = [["Character", "╤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxHu; with a semi-colon" do
+    input = "&boxHu;"
+    output = [["Character", "╧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxUL; with a semi-colon" do
+    input = "&boxUL;"
+    output = [["Character", "╝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxUR; with a semi-colon" do
+    input = "&boxUR;"
+    output = [["Character", "╚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxUl; with a semi-colon" do
+    input = "&boxUl;"
+    output = [["Character", "╜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxUr; with a semi-colon" do
+    input = "&boxUr;"
+    output = [["Character", "╙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxV; with a semi-colon" do
+    input = "&boxV;"
+    output = [["Character", "║"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxVH; with a semi-colon" do
+    input = "&boxVH;"
+    output = [["Character", "╬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxVL; with a semi-colon" do
+    input = "&boxVL;"
+    output = [["Character", "╣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxVR; with a semi-colon" do
+    input = "&boxVR;"
+    output = [["Character", "╠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxVh; with a semi-colon" do
+    input = "&boxVh;"
+    output = [["Character", "╫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxVl; with a semi-colon" do
+    input = "&boxVl;"
+    output = [["Character", "╢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxVr; with a semi-colon" do
+    input = "&boxVr;"
+    output = [["Character", "╟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxbox; with a semi-colon" do
+    input = "&boxbox;"
+    output = [["Character", "⧉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxdL; with a semi-colon" do
+    input = "&boxdL;"
+    output = [["Character", "╕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxdR; with a semi-colon" do
+    input = "&boxdR;"
+    output = [["Character", "╒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxdl; with a semi-colon" do
+    input = "&boxdl;"
+    output = [["Character", "┐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxdr; with a semi-colon" do
+    input = "&boxdr;"
+    output = [["Character", "┌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxh; with a semi-colon" do
+    input = "&boxh;"
+    output = [["Character", "─"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxhD; with a semi-colon" do
+    input = "&boxhD;"
+    output = [["Character", "╥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxhU; with a semi-colon" do
+    input = "&boxhU;"
+    output = [["Character", "╨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxhd; with a semi-colon" do
+    input = "&boxhd;"
+    output = [["Character", "┬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxhu; with a semi-colon" do
+    input = "&boxhu;"
+    output = [["Character", "┴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxminus; with a semi-colon" do
+    input = "&boxminus;"
+    output = [["Character", "⊟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxplus; with a semi-colon" do
+    input = "&boxplus;"
+    output = [["Character", "⊞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxtimes; with a semi-colon" do
+    input = "&boxtimes;"
+    output = [["Character", "⊠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxuL; with a semi-colon" do
+    input = "&boxuL;"
+    output = [["Character", "╛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxuR; with a semi-colon" do
+    input = "&boxuR;"
+    output = [["Character", "╘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxul; with a semi-colon" do
+    input = "&boxul;"
+    output = [["Character", "┘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxur; with a semi-colon" do
+    input = "&boxur;"
+    output = [["Character", "└"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxv; with a semi-colon" do
+    input = "&boxv;"
+    output = [["Character", "│"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxvH; with a semi-colon" do
+    input = "&boxvH;"
+    output = [["Character", "╪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxvL; with a semi-colon" do
+    input = "&boxvL;"
+    output = [["Character", "╡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxvR; with a semi-colon" do
+    input = "&boxvR;"
+    output = [["Character", "╞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxvh; with a semi-colon" do
+    input = "&boxvh;"
+    output = [["Character", "┼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxvl; with a semi-colon" do
+    input = "&boxvl;"
+    output = [["Character", "┤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: boxvr; with a semi-colon" do
+    input = "&boxvr;"
+    output = [["Character", "├"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bprime; with a semi-colon" do
+    input = "&bprime;"
+    output = [["Character", "‵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: breve; with a semi-colon" do
+    input = "&breve;"
+    output = [["Character", "˘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: brvbar without a semi-colon" do
+    input = "&brvbar"
+    output = [["Character", "¦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: brvbar; with a semi-colon" do
+    input = "&brvbar;"
+    output = [["Character", "¦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bscr; with a semi-colon" do
+    input = "&bscr;"
+    output = [["Character", "𝒷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bsemi; with a semi-colon" do
+    input = "&bsemi;"
+    output = [["Character", "⁏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bsim; with a semi-colon" do
+    input = "&bsim;"
+    output = [["Character", "∽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bsime; with a semi-colon" do
+    input = "&bsime;"
+    output = [["Character", "⋍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bsol; with a semi-colon" do
+    input = "&bsol;"
+    output = [["Character", "\\"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bsolb; with a semi-colon" do
+    input = "&bsolb;"
+    output = [["Character", "⧅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bsolhsub; with a semi-colon" do
+    input = "&bsolhsub;"
+    output = [["Character", "⟈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bull; with a semi-colon" do
+    input = "&bull;"
+    output = [["Character", "•"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bullet; with a semi-colon" do
+    input = "&bullet;"
+    output = [["Character", "•"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bump; with a semi-colon" do
+    input = "&bump;"
+    output = [["Character", "≎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bumpE; with a semi-colon" do
+    input = "&bumpE;"
+    output = [["Character", "⪮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bumpe; with a semi-colon" do
+    input = "&bumpe;"
+    output = [["Character", "≏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: bumpeq; with a semi-colon" do
+    input = "&bumpeq;"
+    output = [["Character", "≏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cacute; with a semi-colon" do
+    input = "&cacute;"
+    output = [["Character", "ć"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cap; with a semi-colon" do
+    input = "&cap;"
+    output = [["Character", "∩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part29_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part29_test.exs
new file mode 100644
index 00000000..08febdcb
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part29_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart29Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: capand; with a semi-colon" do
+    input = "&capand;"
+    output = [["Character", "⩄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: capbrcup; with a semi-colon" do
+    input = "&capbrcup;"
+    output = [["Character", "⩉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: capcap; with a semi-colon" do
+    input = "&capcap;"
+    output = [["Character", "⩋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: capcup; with a semi-colon" do
+    input = "&capcup;"
+    output = [["Character", "⩇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: capdot; with a semi-colon" do
+    input = "&capdot;"
+    output = [["Character", "⩀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: caps; with a semi-colon" do
+    input = "&caps;"
+    output = [["Character", "∩︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: caret; with a semi-colon" do
+    input = "&caret;"
+    output = [["Character", "⁁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: caron; with a semi-colon" do
+    input = "&caron;"
+    output = [["Character", "ˇ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccaps; with a semi-colon" do
+    input = "&ccaps;"
+    output = [["Character", "⩍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccaron; with a semi-colon" do
+    input = "&ccaron;"
+    output = [["Character", "č"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccedil without a semi-colon" do
+    input = "&ccedil"
+    output = [["Character", "ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccedil; with a semi-colon" do
+    input = "&ccedil;"
+    output = [["Character", "ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccirc; with a semi-colon" do
+    input = "&ccirc;"
+    output = [["Character", "ĉ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccups; with a semi-colon" do
+    input = "&ccups;"
+    output = [["Character", "⩌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ccupssm; with a semi-colon" do
+    input = "&ccupssm;"
+    output = [["Character", "⩐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cdot; with a semi-colon" do
+    input = "&cdot;"
+    output = [["Character", "ċ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cedil without a semi-colon" do
+    input = "&cedil"
+    output = [["Character", "¸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cedil; with a semi-colon" do
+    input = "&cedil;"
+    output = [["Character", "¸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cemptyv; with a semi-colon" do
+    input = "&cemptyv;"
+    output = [["Character", "⦲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cent without a semi-colon" do
+    input = "&cent"
+    output = [["Character", "¢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cent; with a semi-colon" do
+    input = "&cent;"
+    output = [["Character", "¢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: centerdot; with a semi-colon" do
+    input = "&centerdot;"
+    output = [["Character", "·"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cfr; with a semi-colon" do
+    input = "&cfr;"
+    output = [["Character", "𝔠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: chcy; with a semi-colon" do
+    input = "&chcy;"
+    output = [["Character", "ч"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: check; with a semi-colon" do
+    input = "&check;"
+    output = [["Character", "✓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: checkmark; with a semi-colon" do
+    input = "&checkmark;"
+    output = [["Character", "✓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: chi; with a semi-colon" do
+    input = "&chi;"
+    output = [["Character", "χ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cir; with a semi-colon" do
+    input = "&cir;"
+    output = [["Character", "○"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cirE; with a semi-colon" do
+    input = "&cirE;"
+    output = [["Character", "⧃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circ; with a semi-colon" do
+    input = "&circ;"
+    output = [["Character", "ˆ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circeq; with a semi-colon" do
+    input = "&circeq;"
+    output = [["Character", "≗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circlearrowleft; with a semi-colon" do
+    input = "&circlearrowleft;"
+    output = [["Character", "↺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circlearrowright; with a semi-colon" do
+    input = "&circlearrowright;"
+    output = [["Character", "↻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circledR; with a semi-colon" do
+    input = "&circledR;"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circledS; with a semi-colon" do
+    input = "&circledS;"
+    output = [["Character", "Ⓢ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circledast; with a semi-colon" do
+    input = "&circledast;"
+    output = [["Character", "⊛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circledcirc; with a semi-colon" do
+    input = "&circledcirc;"
+    output = [["Character", "⊚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: circleddash; with a semi-colon" do
+    input = "&circleddash;"
+    output = [["Character", "⊝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cire; with a semi-colon" do
+    input = "&cire;"
+    output = [["Character", "≗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cirfnint; with a semi-colon" do
+    input = "&cirfnint;"
+    output = [["Character", "⨐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cirmid; with a semi-colon" do
+    input = "&cirmid;"
+    output = [["Character", "⫯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cirscir; with a semi-colon" do
+    input = "&cirscir;"
+    output = [["Character", "⧂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: clubs; with a semi-colon" do
+    input = "&clubs;"
+    output = [["Character", "♣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: clubsuit; with a semi-colon" do
+    input = "&clubsuit;"
+    output = [["Character", "♣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: colon; with a semi-colon" do
+    input = "&colon;"
+    output = [["Character", ":"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: colone; with a semi-colon" do
+    input = "&colone;"
+    output = [["Character", "≔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: coloneq; with a semi-colon" do
+    input = "&coloneq;"
+    output = [["Character", "≔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: comma; with a semi-colon" do
+    input = "&comma;"
+    output = [["Character", ","]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: commat; with a semi-colon" do
+    input = "&commat;"
+    output = [["Character", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: comp; with a semi-colon" do
+    input = "&comp;"
+    output = [["Character", "∁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: compfn; with a semi-colon" do
+    input = "&compfn;"
+    output = [["Character", "∘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: complement; with a semi-colon" do
+    input = "&complement;"
+    output = [["Character", "∁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: complexes; with a semi-colon" do
+    input = "&complexes;"
+    output = [["Character", "ℂ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cong; with a semi-colon" do
+    input = "&cong;"
+    output = [["Character", "≅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: congdot; with a semi-colon" do
+    input = "&congdot;"
+    output = [["Character", "⩭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: conint; with a semi-colon" do
+    input = "&conint;"
+    output = [["Character", "∮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: copf; with a semi-colon" do
+    input = "&copf;"
+    output = [["Character", "𝕔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: coprod; with a semi-colon" do
+    input = "&coprod;"
+    output = [["Character", "∐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: copy without a semi-colon" do
+    input = "&copy"
+    output = [["Character", "©"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: copy; with a semi-colon" do
+    input = "&copy;"
+    output = [["Character", "©"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: copysr; with a semi-colon" do
+    input = "&copysr;"
+    output = [["Character", "℗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: crarr; with a semi-colon" do
+    input = "&crarr;"
+    output = [["Character", "↵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cross; with a semi-colon" do
+    input = "&cross;"
+    output = [["Character", "✗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cscr; with a semi-colon" do
+    input = "&cscr;"
+    output = [["Character", "𝒸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: csub; with a semi-colon" do
+    input = "&csub;"
+    output = [["Character", "⫏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: csube; with a semi-colon" do
+    input = "&csube;"
+    output = [["Character", "⫑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: csup; with a semi-colon" do
+    input = "&csup;"
+    output = [["Character", "⫐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: csupe; with a semi-colon" do
+    input = "&csupe;"
+    output = [["Character", "⫒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ctdot; with a semi-colon" do
+    input = "&ctdot;"
+    output = [["Character", "⋯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cudarrl; with a semi-colon" do
+    input = "&cudarrl;"
+    output = [["Character", "⤸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cudarrr; with a semi-colon" do
+    input = "&cudarrr;"
+    output = [["Character", "⤵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cuepr; with a semi-colon" do
+    input = "&cuepr;"
+    output = [["Character", "⋞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cuesc; with a semi-colon" do
+    input = "&cuesc;"
+    output = [["Character", "⋟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cularr; with a semi-colon" do
+    input = "&cularr;"
+    output = [["Character", "↶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cularrp; with a semi-colon" do
+    input = "&cularrp;"
+    output = [["Character", "⤽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cup; with a semi-colon" do
+    input = "&cup;"
+    output = [["Character", "∪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cupbrcap; with a semi-colon" do
+    input = "&cupbrcap;"
+    output = [["Character", "⩈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cupcap; with a semi-colon" do
+    input = "&cupcap;"
+    output = [["Character", "⩆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cupcup; with a semi-colon" do
+    input = "&cupcup;"
+    output = [["Character", "⩊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cupdot; with a semi-colon" do
+    input = "&cupdot;"
+    output = [["Character", "⊍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cupor; with a semi-colon" do
+    input = "&cupor;"
+    output = [["Character", "⩅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cups; with a semi-colon" do
+    input = "&cups;"
+    output = [["Character", "∪︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curarr; with a semi-colon" do
+    input = "&curarr;"
+    output = [["Character", "↷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curarrm; with a semi-colon" do
+    input = "&curarrm;"
+    output = [["Character", "⤼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curlyeqprec; with a semi-colon" do
+    input = "&curlyeqprec;"
+    output = [["Character", "⋞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curlyeqsucc; with a semi-colon" do
+    input = "&curlyeqsucc;"
+    output = [["Character", "⋟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curlyvee; with a semi-colon" do
+    input = "&curlyvee;"
+    output = [["Character", "⋎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curlywedge; with a semi-colon" do
+    input = "&curlywedge;"
+    output = [["Character", "⋏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curren without a semi-colon" do
+    input = "&curren"
+    output = [["Character", "¤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curren; with a semi-colon" do
+    input = "&curren;"
+    output = [["Character", "¤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curvearrowleft; with a semi-colon" do
+    input = "&curvearrowleft;"
+    output = [["Character", "↶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: curvearrowright; with a semi-colon" do
+    input = "&curvearrowright;"
+    output = [["Character", "↷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cuvee; with a semi-colon" do
+    input = "&cuvee;"
+    output = [["Character", "⋎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cuwed; with a semi-colon" do
+    input = "&cuwed;"
+    output = [["Character", "⋏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cwconint; with a semi-colon" do
+    input = "&cwconint;"
+    output = [["Character", "∲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cwint; with a semi-colon" do
+    input = "&cwint;"
+    output = [["Character", "∱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: cylcty; with a semi-colon" do
+    input = "&cylcty;"
+    output = [["Character", "⌭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dArr; with a semi-colon" do
+    input = "&dArr;"
+    output = [["Character", "⇓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dHar; with a semi-colon" do
+    input = "&dHar;"
+    output = [["Character", "⥥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dagger; with a semi-colon" do
+    input = "&dagger;"
+    output = [["Character", "†"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part2_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part2_test.exs
new file mode 100644
index 00000000..613a2f98
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part2_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart2Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: DownLeftVectorBar without a semi-colon" do
+    input = "&DownLeftVectorBar"
+    output = [["Character", "&DownLeftVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownRightTeeVector without a semi-colon" do
+    input = "&DownRightTeeVector"
+    output = [["Character", "&DownRightTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownRightVector without a semi-colon" do
+    input = "&DownRightVector"
+    output = [["Character", "&DownRightVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownRightVectorBar without a semi-colon" do
+    input = "&DownRightVectorBar"
+    output = [["Character", "&DownRightVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownTee without a semi-colon" do
+    input = "&DownTee"
+    output = [["Character", "&DownTee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: DownTeeArrow without a semi-colon" do
+    input = "&DownTeeArrow"
+    output = [["Character", "&DownTeeArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Downarrow without a semi-colon" do
+    input = "&Downarrow"
+    output = [["Character", "&Downarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dscr without a semi-colon" do
+    input = "&Dscr"
+    output = [["Character", "&Dscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Dstrok without a semi-colon" do
+    input = "&Dstrok"
+    output = [["Character", "&Dstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ENG without a semi-colon" do
+    input = "&ENG"
+    output = [["Character", "&ENG"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ecaron without a semi-colon" do
+    input = "&Ecaron"
+    output = [["Character", "&Ecaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ecy without a semi-colon" do
+    input = "&Ecy"
+    output = [["Character", "&Ecy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Edot without a semi-colon" do
+    input = "&Edot"
+    output = [["Character", "&Edot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Efr without a semi-colon" do
+    input = "&Efr"
+    output = [["Character", "&Efr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Element without a semi-colon" do
+    input = "&Element"
+    output = [["Character", "&Element"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Emacr without a semi-colon" do
+    input = "&Emacr"
+    output = [["Character", "&Emacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: EmptySmallSquare without a semi-colon" do
+    input = "&EmptySmallSquare"
+    output = [["Character", "&EmptySmallSquare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: EmptyVerySmallSquare without a semi-colon" do
+    input = "&EmptyVerySmallSquare"
+    output = [["Character", "&EmptyVerySmallSquare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Eogon without a semi-colon" do
+    input = "&Eogon"
+    output = [["Character", "&Eogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Eopf without a semi-colon" do
+    input = "&Eopf"
+    output = [["Character", "&Eopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Epsilon without a semi-colon" do
+    input = "&Epsilon"
+    output = [["Character", "&Epsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Equal without a semi-colon" do
+    input = "&Equal"
+    output = [["Character", "&Equal"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: EqualTilde without a semi-colon" do
+    input = "&EqualTilde"
+    output = [["Character", "&EqualTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Equilibrium without a semi-colon" do
+    input = "&Equilibrium"
+    output = [["Character", "&Equilibrium"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Escr without a semi-colon" do
+    input = "&Escr"
+    output = [["Character", "&Escr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Esim without a semi-colon" do
+    input = "&Esim"
+    output = [["Character", "&Esim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Eta without a semi-colon" do
+    input = "&Eta"
+    output = [["Character", "&Eta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Exists without a semi-colon" do
+    input = "&Exists"
+    output = [["Character", "&Exists"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ExponentialE without a semi-colon" do
+    input = "&ExponentialE"
+    output = [["Character", "&ExponentialE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Fcy without a semi-colon" do
+    input = "&Fcy"
+    output = [["Character", "&Fcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ffr without a semi-colon" do
+    input = "&Ffr"
+    output = [["Character", "&Ffr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: FilledSmallSquare without a semi-colon" do
+    input = "&FilledSmallSquare"
+    output = [["Character", "&FilledSmallSquare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: FilledVerySmallSquare without a semi-colon" do
+    input = "&FilledVerySmallSquare"
+    output = [["Character", "&FilledVerySmallSquare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Fopf without a semi-colon" do
+    input = "&Fopf"
+    output = [["Character", "&Fopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ForAll without a semi-colon" do
+    input = "&ForAll"
+    output = [["Character", "&ForAll"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Fouriertrf without a semi-colon" do
+    input = "&Fouriertrf"
+    output = [["Character", "&Fouriertrf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Fscr without a semi-colon" do
+    input = "&Fscr"
+    output = [["Character", "&Fscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GJcy without a semi-colon" do
+    input = "&GJcy"
+    output = [["Character", "&GJcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gamma without a semi-colon" do
+    input = "&Gamma"
+    output = [["Character", "&Gamma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gammad without a semi-colon" do
+    input = "&Gammad"
+    output = [["Character", "&Gammad"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gbreve without a semi-colon" do
+    input = "&Gbreve"
+    output = [["Character", "&Gbreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gcedil without a semi-colon" do
+    input = "&Gcedil"
+    output = [["Character", "&Gcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gcirc without a semi-colon" do
+    input = "&Gcirc"
+    output = [["Character", "&Gcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gcy without a semi-colon" do
+    input = "&Gcy"
+    output = [["Character", "&Gcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gdot without a semi-colon" do
+    input = "&Gdot"
+    output = [["Character", "&Gdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gfr without a semi-colon" do
+    input = "&Gfr"
+    output = [["Character", "&Gfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gg without a semi-colon" do
+    input = "&Gg"
+    output = [["Character", "&Gg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gopf without a semi-colon" do
+    input = "&Gopf"
+    output = [["Character", "&Gopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterEqual without a semi-colon" do
+    input = "&GreaterEqual"
+    output = [["Character", "&GreaterEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterEqualLess without a semi-colon" do
+    input = "&GreaterEqualLess"
+    output = [["Character", "&GreaterEqualLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterFullEqual without a semi-colon" do
+    input = "&GreaterFullEqual"
+    output = [["Character", "&GreaterFullEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterGreater without a semi-colon" do
+    input = "&GreaterGreater"
+    output = [["Character", "&GreaterGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterLess without a semi-colon" do
+    input = "&GreaterLess"
+    output = [["Character", "&GreaterLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterSlantEqual without a semi-colon" do
+    input = "&GreaterSlantEqual"
+    output = [["Character", "&GreaterSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: GreaterTilde without a semi-colon" do
+    input = "&GreaterTilde"
+    output = [["Character", "&GreaterTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gscr without a semi-colon" do
+    input = "&Gscr"
+    output = [["Character", "&Gscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Gt without a semi-colon" do
+    input = "&Gt"
+    output = [["Character", "&Gt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: HARDcy without a semi-colon" do
+    input = "&HARDcy"
+    output = [["Character", "&HARDcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hacek without a semi-colon" do
+    input = "&Hacek"
+    output = [["Character", "&Hacek"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hat without a semi-colon" do
+    input = "&Hat"
+    output = [["Character", "&Hat"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hcirc without a semi-colon" do
+    input = "&Hcirc"
+    output = [["Character", "&Hcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hfr without a semi-colon" do
+    input = "&Hfr"
+    output = [["Character", "&Hfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: HilbertSpace without a semi-colon" do
+    input = "&HilbertSpace"
+    output = [["Character", "&HilbertSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hopf without a semi-colon" do
+    input = "&Hopf"
+    output = [["Character", "&Hopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: HorizontalLine without a semi-colon" do
+    input = "&HorizontalLine"
+    output = [["Character", "&HorizontalLine"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hscr without a semi-colon" do
+    input = "&Hscr"
+    output = [["Character", "&Hscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Hstrok without a semi-colon" do
+    input = "&Hstrok"
+    output = [["Character", "&Hstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: HumpDownHump without a semi-colon" do
+    input = "&HumpDownHump"
+    output = [["Character", "&HumpDownHump"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: HumpEqual without a semi-colon" do
+    input = "&HumpEqual"
+    output = [["Character", "&HumpEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: IEcy without a semi-colon" do
+    input = "&IEcy"
+    output = [["Character", "&IEcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: IJlig without a semi-colon" do
+    input = "&IJlig"
+    output = [["Character", "&IJlig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: IOcy without a semi-colon" do
+    input = "&IOcy"
+    output = [["Character", "&IOcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Icy without a semi-colon" do
+    input = "&Icy"
+    output = [["Character", "&Icy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Idot without a semi-colon" do
+    input = "&Idot"
+    output = [["Character", "&Idot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ifr without a semi-colon" do
+    input = "&Ifr"
+    output = [["Character", "&Ifr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Im without a semi-colon" do
+    input = "&Im"
+    output = [["Character", "&Im"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Imacr without a semi-colon" do
+    input = "&Imacr"
+    output = [["Character", "&Imacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ImaginaryI without a semi-colon" do
+    input = "&ImaginaryI"
+    output = [["Character", "&ImaginaryI"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Implies without a semi-colon" do
+    input = "&Implies"
+    output = [["Character", "&Implies"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Int without a semi-colon" do
+    input = "&Int"
+    output = [["Character", "&Int"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Integral without a semi-colon" do
+    input = "&Integral"
+    output = [["Character", "&Integral"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Intersection without a semi-colon" do
+    input = "&Intersection"
+    output = [["Character", "&Intersection"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: InvisibleComma without a semi-colon" do
+    input = "&InvisibleComma"
+    output = [["Character", "&InvisibleComma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: InvisibleTimes without a semi-colon" do
+    input = "&InvisibleTimes"
+    output = [["Character", "&InvisibleTimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Iogon without a semi-colon" do
+    input = "&Iogon"
+    output = [["Character", "&Iogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Iopf without a semi-colon" do
+    input = "&Iopf"
+    output = [["Character", "&Iopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Iota without a semi-colon" do
+    input = "&Iota"
+    output = [["Character", "&Iota"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Iscr without a semi-colon" do
+    input = "&Iscr"
+    output = [["Character", "&Iscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Itilde without a semi-colon" do
+    input = "&Itilde"
+    output = [["Character", "&Itilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Iukcy without a semi-colon" do
+    input = "&Iukcy"
+    output = [["Character", "&Iukcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jcirc without a semi-colon" do
+    input = "&Jcirc"
+    output = [["Character", "&Jcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jcy without a semi-colon" do
+    input = "&Jcy"
+    output = [["Character", "&Jcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jfr without a semi-colon" do
+    input = "&Jfr"
+    output = [["Character", "&Jfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jopf without a semi-colon" do
+    input = "&Jopf"
+    output = [["Character", "&Jopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jscr without a semi-colon" do
+    input = "&Jscr"
+    output = [["Character", "&Jscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jsercy without a semi-colon" do
+    input = "&Jsercy"
+    output = [["Character", "&Jsercy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Jukcy without a semi-colon" do
+    input = "&Jukcy"
+    output = [["Character", "&Jukcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: KHcy without a semi-colon" do
+    input = "&KHcy"
+    output = [["Character", "&KHcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: KJcy without a semi-colon" do
+    input = "&KJcy"
+    output = [["Character", "&KJcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Kappa without a semi-colon" do
+    input = "&Kappa"
+    output = [["Character", "&Kappa"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part30_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part30_test.exs
new file mode 100644
index 00000000..80036071
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part30_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart30Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: daleth; with a semi-colon" do
+    input = "&daleth;"
+    output = [["Character", "ℸ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: darr; with a semi-colon" do
+    input = "&darr;"
+    output = [["Character", "↓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dash; with a semi-colon" do
+    input = "&dash;"
+    output = [["Character", "‐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dashv; with a semi-colon" do
+    input = "&dashv;"
+    output = [["Character", "⊣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dbkarow; with a semi-colon" do
+    input = "&dbkarow;"
+    output = [["Character", "⤏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dblac; with a semi-colon" do
+    input = "&dblac;"
+    output = [["Character", "˝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dcaron; with a semi-colon" do
+    input = "&dcaron;"
+    output = [["Character", "ď"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dcy; with a semi-colon" do
+    input = "&dcy;"
+    output = [["Character", "д"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dd; with a semi-colon" do
+    input = "&dd;"
+    output = [["Character", "ⅆ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ddagger; with a semi-colon" do
+    input = "&ddagger;"
+    output = [["Character", "‡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ddarr; with a semi-colon" do
+    input = "&ddarr;"
+    output = [["Character", "⇊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ddotseq; with a semi-colon" do
+    input = "&ddotseq;"
+    output = [["Character", "⩷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: deg without a semi-colon" do
+    input = "&deg"
+    output = [["Character", "°"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: deg; with a semi-colon" do
+    input = "&deg;"
+    output = [["Character", "°"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: delta; with a semi-colon" do
+    input = "&delta;"
+    output = [["Character", "δ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: demptyv; with a semi-colon" do
+    input = "&demptyv;"
+    output = [["Character", "⦱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dfisht; with a semi-colon" do
+    input = "&dfisht;"
+    output = [["Character", "⥿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dfr; with a semi-colon" do
+    input = "&dfr;"
+    output = [["Character", "𝔡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dharl; with a semi-colon" do
+    input = "&dharl;"
+    output = [["Character", "⇃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dharr; with a semi-colon" do
+    input = "&dharr;"
+    output = [["Character", "⇂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: diam; with a semi-colon" do
+    input = "&diam;"
+    output = [["Character", "⋄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: diamond; with a semi-colon" do
+    input = "&diamond;"
+    output = [["Character", "⋄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: diamondsuit; with a semi-colon" do
+    input = "&diamondsuit;"
+    output = [["Character", "♦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: diams; with a semi-colon" do
+    input = "&diams;"
+    output = [["Character", "♦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: die; with a semi-colon" do
+    input = "&die;"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: digamma; with a semi-colon" do
+    input = "&digamma;"
+    output = [["Character", "ϝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: disin; with a semi-colon" do
+    input = "&disin;"
+    output = [["Character", "⋲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: div; with a semi-colon" do
+    input = "&div;"
+    output = [["Character", "÷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: divide without a semi-colon" do
+    input = "&divide"
+    output = [["Character", "÷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: divide; with a semi-colon" do
+    input = "&divide;"
+    output = [["Character", "÷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: divideontimes; with a semi-colon" do
+    input = "&divideontimes;"
+    output = [["Character", "⋇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: divonx; with a semi-colon" do
+    input = "&divonx;"
+    output = [["Character", "⋇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: djcy; with a semi-colon" do
+    input = "&djcy;"
+    output = [["Character", "ђ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dlcorn; with a semi-colon" do
+    input = "&dlcorn;"
+    output = [["Character", "⌞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dlcrop; with a semi-colon" do
+    input = "&dlcrop;"
+    output = [["Character", "⌍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dollar; with a semi-colon" do
+    input = "&dollar;"
+    output = [["Character", "$"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dopf; with a semi-colon" do
+    input = "&dopf;"
+    output = [["Character", "𝕕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dot; with a semi-colon" do
+    input = "&dot;"
+    output = [["Character", "˙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: doteq; with a semi-colon" do
+    input = "&doteq;"
+    output = [["Character", "≐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: doteqdot; with a semi-colon" do
+    input = "&doteqdot;"
+    output = [["Character", "≑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dotminus; with a semi-colon" do
+    input = "&dotminus;"
+    output = [["Character", "∸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dotplus; with a semi-colon" do
+    input = "&dotplus;"
+    output = [["Character", "∔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dotsquare; with a semi-colon" do
+    input = "&dotsquare;"
+    output = [["Character", "⊡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: doublebarwedge; with a semi-colon" do
+    input = "&doublebarwedge;"
+    output = [["Character", "⌆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: downarrow; with a semi-colon" do
+    input = "&downarrow;"
+    output = [["Character", "↓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: downdownarrows; with a semi-colon" do
+    input = "&downdownarrows;"
+    output = [["Character", "⇊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: downharpoonleft; with a semi-colon" do
+    input = "&downharpoonleft;"
+    output = [["Character", "⇃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: downharpoonright; with a semi-colon" do
+    input = "&downharpoonright;"
+    output = [["Character", "⇂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: drbkarow; with a semi-colon" do
+    input = "&drbkarow;"
+    output = [["Character", "⤐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: drcorn; with a semi-colon" do
+    input = "&drcorn;"
+    output = [["Character", "⌟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: drcrop; with a semi-colon" do
+    input = "&drcrop;"
+    output = [["Character", "⌌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dscr; with a semi-colon" do
+    input = "&dscr;"
+    output = [["Character", "𝒹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dscy; with a semi-colon" do
+    input = "&dscy;"
+    output = [["Character", "ѕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dsol; with a semi-colon" do
+    input = "&dsol;"
+    output = [["Character", "⧶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dstrok; with a semi-colon" do
+    input = "&dstrok;"
+    output = [["Character", "đ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dtdot; with a semi-colon" do
+    input = "&dtdot;"
+    output = [["Character", "⋱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dtri; with a semi-colon" do
+    input = "&dtri;"
+    output = [["Character", "▿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dtrif; with a semi-colon" do
+    input = "&dtrif;"
+    output = [["Character", "▾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: duarr; with a semi-colon" do
+    input = "&duarr;"
+    output = [["Character", "⇵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: duhar; with a semi-colon" do
+    input = "&duhar;"
+    output = [["Character", "⥯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dwangle; with a semi-colon" do
+    input = "&dwangle;"
+    output = [["Character", "⦦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dzcy; with a semi-colon" do
+    input = "&dzcy;"
+    output = [["Character", "џ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: dzigrarr; with a semi-colon" do
+    input = "&dzigrarr;"
+    output = [["Character", "⟿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eDDot; with a semi-colon" do
+    input = "&eDDot;"
+    output = [["Character", "⩷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eDot; with a semi-colon" do
+    input = "&eDot;"
+    output = [["Character", "≑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eacute without a semi-colon" do
+    input = "&eacute"
+    output = [["Character", "é"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eacute; with a semi-colon" do
+    input = "&eacute;"
+    output = [["Character", "é"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: easter; with a semi-colon" do
+    input = "&easter;"
+    output = [["Character", "⩮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ecaron; with a semi-colon" do
+    input = "&ecaron;"
+    output = [["Character", "ě"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ecir; with a semi-colon" do
+    input = "&ecir;"
+    output = [["Character", "≖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ecirc without a semi-colon" do
+    input = "&ecirc"
+    output = [["Character", "ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ecirc; with a semi-colon" do
+    input = "&ecirc;"
+    output = [["Character", "ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ecolon; with a semi-colon" do
+    input = "&ecolon;"
+    output = [["Character", "≕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ecy; with a semi-colon" do
+    input = "&ecy;"
+    output = [["Character", "э"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: edot; with a semi-colon" do
+    input = "&edot;"
+    output = [["Character", "ė"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ee; with a semi-colon" do
+    input = "&ee;"
+    output = [["Character", "ⅇ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: efDot; with a semi-colon" do
+    input = "&efDot;"
+    output = [["Character", "≒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: efr; with a semi-colon" do
+    input = "&efr;"
+    output = [["Character", "𝔢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eg; with a semi-colon" do
+    input = "&eg;"
+    output = [["Character", "⪚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: egrave without a semi-colon" do
+    input = "&egrave"
+    output = [["Character", "è"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: egrave; with a semi-colon" do
+    input = "&egrave;"
+    output = [["Character", "è"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: egs; with a semi-colon" do
+    input = "&egs;"
+    output = [["Character", "⪖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: egsdot; with a semi-colon" do
+    input = "&egsdot;"
+    output = [["Character", "⪘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: el; with a semi-colon" do
+    input = "&el;"
+    output = [["Character", "⪙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: elinters; with a semi-colon" do
+    input = "&elinters;"
+    output = [["Character", "⏧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ell; with a semi-colon" do
+    input = "&ell;"
+    output = [["Character", "ℓ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: els; with a semi-colon" do
+    input = "&els;"
+    output = [["Character", "⪕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: elsdot; with a semi-colon" do
+    input = "&elsdot;"
+    output = [["Character", "⪗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: emacr; with a semi-colon" do
+    input = "&emacr;"
+    output = [["Character", "ē"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: empty; with a semi-colon" do
+    input = "&empty;"
+    output = [["Character", "∅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: emptyset; with a semi-colon" do
+    input = "&emptyset;"
+    output = [["Character", "∅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: emptyv; with a semi-colon" do
+    input = "&emptyv;"
+    output = [["Character", "∅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: emsp13; with a semi-colon" do
+    input = "&emsp13;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: emsp14; with a semi-colon" do
+    input = "&emsp14;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: emsp; with a semi-colon" do
+    input = "&emsp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eng; with a semi-colon" do
+    input = "&eng;"
+    output = [["Character", "ŋ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ensp; with a semi-colon" do
+    input = "&ensp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eogon; with a semi-colon" do
+    input = "&eogon;"
+    output = [["Character", "ę"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eopf; with a semi-colon" do
+    input = "&eopf;"
+    output = [["Character", "𝕖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: epar; with a semi-colon" do
+    input = "&epar;"
+    output = [["Character", "⋕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part31_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part31_test.exs
new file mode 100644
index 00000000..c61e7289
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part31_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart31Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: eparsl; with a semi-colon" do
+    input = "&eparsl;"
+    output = [["Character", "⧣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eplus; with a semi-colon" do
+    input = "&eplus;"
+    output = [["Character", "⩱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: epsi; with a semi-colon" do
+    input = "&epsi;"
+    output = [["Character", "ε"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: epsilon; with a semi-colon" do
+    input = "&epsilon;"
+    output = [["Character", "ε"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: epsiv; with a semi-colon" do
+    input = "&epsiv;"
+    output = [["Character", "ϵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eqcirc; with a semi-colon" do
+    input = "&eqcirc;"
+    output = [["Character", "≖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eqcolon; with a semi-colon" do
+    input = "&eqcolon;"
+    output = [["Character", "≕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eqsim; with a semi-colon" do
+    input = "&eqsim;"
+    output = [["Character", "≂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eqslantgtr; with a semi-colon" do
+    input = "&eqslantgtr;"
+    output = [["Character", "⪖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eqslantless; with a semi-colon" do
+    input = "&eqslantless;"
+    output = [["Character", "⪕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: equals; with a semi-colon" do
+    input = "&equals;"
+    output = [["Character", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: equest; with a semi-colon" do
+    input = "&equest;"
+    output = [["Character", "≟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: equiv; with a semi-colon" do
+    input = "&equiv;"
+    output = [["Character", "≡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: equivDD; with a semi-colon" do
+    input = "&equivDD;"
+    output = [["Character", "⩸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eqvparsl; with a semi-colon" do
+    input = "&eqvparsl;"
+    output = [["Character", "⧥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: erDot; with a semi-colon" do
+    input = "&erDot;"
+    output = [["Character", "≓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: erarr; with a semi-colon" do
+    input = "&erarr;"
+    output = [["Character", "⥱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: escr; with a semi-colon" do
+    input = "&escr;"
+    output = [["Character", "ℯ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: esdot; with a semi-colon" do
+    input = "&esdot;"
+    output = [["Character", "≐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: esim; with a semi-colon" do
+    input = "&esim;"
+    output = [["Character", "≂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eta; with a semi-colon" do
+    input = "&eta;"
+    output = [["Character", "η"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eth without a semi-colon" do
+    input = "&eth"
+    output = [["Character", "ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: eth; with a semi-colon" do
+    input = "&eth;"
+    output = [["Character", "ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: euml without a semi-colon" do
+    input = "&euml"
+    output = [["Character", "ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: euml; with a semi-colon" do
+    input = "&euml;"
+    output = [["Character", "ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: euro; with a semi-colon" do
+    input = "&euro;"
+    output = [["Character", "€"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: excl; with a semi-colon" do
+    input = "&excl;"
+    output = [["Character", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: exist; with a semi-colon" do
+    input = "&exist;"
+    output = [["Character", "∃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: expectation; with a semi-colon" do
+    input = "&expectation;"
+    output = [["Character", "ℰ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: exponentiale; with a semi-colon" do
+    input = "&exponentiale;"
+    output = [["Character", "ⅇ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fallingdotseq; with a semi-colon" do
+    input = "&fallingdotseq;"
+    output = [["Character", "≒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fcy; with a semi-colon" do
+    input = "&fcy;"
+    output = [["Character", "ф"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: female; with a semi-colon" do
+    input = "&female;"
+    output = [["Character", "♀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ffilig; with a semi-colon" do
+    input = "&ffilig;"
+    output = [["Character", "ﬃ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fflig; with a semi-colon" do
+    input = "&fflig;"
+    output = [["Character", "ﬀ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ffllig; with a semi-colon" do
+    input = "&ffllig;"
+    output = [["Character", "ﬄ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ffr; with a semi-colon" do
+    input = "&ffr;"
+    output = [["Character", "𝔣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: filig; with a semi-colon" do
+    input = "&filig;"
+    output = [["Character", "ﬁ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fjlig; with a semi-colon" do
+    input = "&fjlig;"
+    output = [["Character", "fj"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: flat; with a semi-colon" do
+    input = "&flat;"
+    output = [["Character", "♭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fllig; with a semi-colon" do
+    input = "&fllig;"
+    output = [["Character", "ﬂ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fltns; with a semi-colon" do
+    input = "&fltns;"
+    output = [["Character", "▱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fnof; with a semi-colon" do
+    input = "&fnof;"
+    output = [["Character", "ƒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fopf; with a semi-colon" do
+    input = "&fopf;"
+    output = [["Character", "𝕗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: forall; with a semi-colon" do
+    input = "&forall;"
+    output = [["Character", "∀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fork; with a semi-colon" do
+    input = "&fork;"
+    output = [["Character", "⋔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: forkv; with a semi-colon" do
+    input = "&forkv;"
+    output = [["Character", "⫙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fpartint; with a semi-colon" do
+    input = "&fpartint;"
+    output = [["Character", "⨍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac12 without a semi-colon" do
+    input = "&frac12"
+    output = [["Character", "½"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac12; with a semi-colon" do
+    input = "&frac12;"
+    output = [["Character", "½"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac13; with a semi-colon" do
+    input = "&frac13;"
+    output = [["Character", "⅓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac14 without a semi-colon" do
+    input = "&frac14"
+    output = [["Character", "¼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac14; with a semi-colon" do
+    input = "&frac14;"
+    output = [["Character", "¼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac15; with a semi-colon" do
+    input = "&frac15;"
+    output = [["Character", "⅕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac16; with a semi-colon" do
+    input = "&frac16;"
+    output = [["Character", "⅙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac18; with a semi-colon" do
+    input = "&frac18;"
+    output = [["Character", "⅛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac23; with a semi-colon" do
+    input = "&frac23;"
+    output = [["Character", "⅔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac25; with a semi-colon" do
+    input = "&frac25;"
+    output = [["Character", "⅖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac34 without a semi-colon" do
+    input = "&frac34"
+    output = [["Character", "¾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac34; with a semi-colon" do
+    input = "&frac34;"
+    output = [["Character", "¾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac35; with a semi-colon" do
+    input = "&frac35;"
+    output = [["Character", "⅗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac38; with a semi-colon" do
+    input = "&frac38;"
+    output = [["Character", "⅜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac45; with a semi-colon" do
+    input = "&frac45;"
+    output = [["Character", "⅘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac56; with a semi-colon" do
+    input = "&frac56;"
+    output = [["Character", "⅚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac58; with a semi-colon" do
+    input = "&frac58;"
+    output = [["Character", "⅝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frac78; with a semi-colon" do
+    input = "&frac78;"
+    output = [["Character", "⅞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frasl; with a semi-colon" do
+    input = "&frasl;"
+    output = [["Character", "⁄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: frown; with a semi-colon" do
+    input = "&frown;"
+    output = [["Character", "⌢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: fscr; with a semi-colon" do
+    input = "&fscr;"
+    output = [["Character", "𝒻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gE; with a semi-colon" do
+    input = "&gE;"
+    output = [["Character", "≧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gEl; with a semi-colon" do
+    input = "&gEl;"
+    output = [["Character", "⪌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gacute; with a semi-colon" do
+    input = "&gacute;"
+    output = [["Character", "ǵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gamma; with a semi-colon" do
+    input = "&gamma;"
+    output = [["Character", "γ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gammad; with a semi-colon" do
+    input = "&gammad;"
+    output = [["Character", "ϝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gap; with a semi-colon" do
+    input = "&gap;"
+    output = [["Character", "⪆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gbreve; with a semi-colon" do
+    input = "&gbreve;"
+    output = [["Character", "ğ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gcirc; with a semi-colon" do
+    input = "&gcirc;"
+    output = [["Character", "ĝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gcy; with a semi-colon" do
+    input = "&gcy;"
+    output = [["Character", "г"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gdot; with a semi-colon" do
+    input = "&gdot;"
+    output = [["Character", "ġ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ge; with a semi-colon" do
+    input = "&ge;"
+    output = [["Character", "≥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gel; with a semi-colon" do
+    input = "&gel;"
+    output = [["Character", "⋛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: geq; with a semi-colon" do
+    input = "&geq;"
+    output = [["Character", "≥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: geqq; with a semi-colon" do
+    input = "&geqq;"
+    output = [["Character", "≧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: geqslant; with a semi-colon" do
+    input = "&geqslant;"
+    output = [["Character", "⩾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ges; with a semi-colon" do
+    input = "&ges;"
+    output = [["Character", "⩾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gescc; with a semi-colon" do
+    input = "&gescc;"
+    output = [["Character", "⪩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gesdot; with a semi-colon" do
+    input = "&gesdot;"
+    output = [["Character", "⪀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gesdoto; with a semi-colon" do
+    input = "&gesdoto;"
+    output = [["Character", "⪂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gesdotol; with a semi-colon" do
+    input = "&gesdotol;"
+    output = [["Character", "⪄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gesl; with a semi-colon" do
+    input = "&gesl;"
+    output = [["Character", "⋛︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gesles; with a semi-colon" do
+    input = "&gesles;"
+    output = [["Character", "⪔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gfr; with a semi-colon" do
+    input = "&gfr;"
+    output = [["Character", "𝔤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gg; with a semi-colon" do
+    input = "&gg;"
+    output = [["Character", "≫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ggg; with a semi-colon" do
+    input = "&ggg;"
+    output = [["Character", "⋙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gimel; with a semi-colon" do
+    input = "&gimel;"
+    output = [["Character", "ℷ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gjcy; with a semi-colon" do
+    input = "&gjcy;"
+    output = [["Character", "ѓ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gl; with a semi-colon" do
+    input = "&gl;"
+    output = [["Character", "≷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: glE; with a semi-colon" do
+    input = "&glE;"
+    output = [["Character", "⪒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gla; with a semi-colon" do
+    input = "&gla;"
+    output = [["Character", "⪥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: glj; with a semi-colon" do
+    input = "&glj;"
+    output = [["Character", "⪤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part32_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part32_test.exs
new file mode 100644
index 00000000..5b673c7b
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part32_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart32Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: gnE; with a semi-colon" do
+    input = "&gnE;"
+    output = [["Character", "≩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gnap; with a semi-colon" do
+    input = "&gnap;"
+    output = [["Character", "⪊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gnapprox; with a semi-colon" do
+    input = "&gnapprox;"
+    output = [["Character", "⪊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gne; with a semi-colon" do
+    input = "&gne;"
+    output = [["Character", "⪈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gneq; with a semi-colon" do
+    input = "&gneq;"
+    output = [["Character", "⪈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gneqq; with a semi-colon" do
+    input = "&gneqq;"
+    output = [["Character", "≩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gnsim; with a semi-colon" do
+    input = "&gnsim;"
+    output = [["Character", "⋧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gopf; with a semi-colon" do
+    input = "&gopf;"
+    output = [["Character", "𝕘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: grave; with a semi-colon" do
+    input = "&grave;"
+    output = [["Character", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gscr; with a semi-colon" do
+    input = "&gscr;"
+    output = [["Character", "ℊ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gsim; with a semi-colon" do
+    input = "&gsim;"
+    output = [["Character", "≳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gsime; with a semi-colon" do
+    input = "&gsime;"
+    output = [["Character", "⪎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gsiml; with a semi-colon" do
+    input = "&gsiml;"
+    output = [["Character", "⪐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gt without a semi-colon" do
+    input = "&gt"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gt; with a semi-colon" do
+    input = "&gt;"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtcc; with a semi-colon" do
+    input = "&gtcc;"
+    output = [["Character", "⪧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtcir; with a semi-colon" do
+    input = "&gtcir;"
+    output = [["Character", "⩺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtdot; with a semi-colon" do
+    input = "&gtdot;"
+    output = [["Character", "⋗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtlPar; with a semi-colon" do
+    input = "&gtlPar;"
+    output = [["Character", "⦕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtquest; with a semi-colon" do
+    input = "&gtquest;"
+    output = [["Character", "⩼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtrapprox; with a semi-colon" do
+    input = "&gtrapprox;"
+    output = [["Character", "⪆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtrarr; with a semi-colon" do
+    input = "&gtrarr;"
+    output = [["Character", "⥸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtrdot; with a semi-colon" do
+    input = "&gtrdot;"
+    output = [["Character", "⋗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtreqless; with a semi-colon" do
+    input = "&gtreqless;"
+    output = [["Character", "⋛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtreqqless; with a semi-colon" do
+    input = "&gtreqqless;"
+    output = [["Character", "⪌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtrless; with a semi-colon" do
+    input = "&gtrless;"
+    output = [["Character", "≷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gtrsim; with a semi-colon" do
+    input = "&gtrsim;"
+    output = [["Character", "≳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gvertneqq; with a semi-colon" do
+    input = "&gvertneqq;"
+    output = [["Character", "≩︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: gvnE; with a semi-colon" do
+    input = "&gvnE;"
+    output = [["Character", "≩︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hArr; with a semi-colon" do
+    input = "&hArr;"
+    output = [["Character", "⇔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hairsp; with a semi-colon" do
+    input = "&hairsp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: half; with a semi-colon" do
+    input = "&half;"
+    output = [["Character", "½"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hamilt; with a semi-colon" do
+    input = "&hamilt;"
+    output = [["Character", "ℋ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hardcy; with a semi-colon" do
+    input = "&hardcy;"
+    output = [["Character", "ъ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: harr; with a semi-colon" do
+    input = "&harr;"
+    output = [["Character", "↔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: harrcir; with a semi-colon" do
+    input = "&harrcir;"
+    output = [["Character", "⥈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: harrw; with a semi-colon" do
+    input = "&harrw;"
+    output = [["Character", "↭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hbar; with a semi-colon" do
+    input = "&hbar;"
+    output = [["Character", "ℏ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hcirc; with a semi-colon" do
+    input = "&hcirc;"
+    output = [["Character", "ĥ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hearts; with a semi-colon" do
+    input = "&hearts;"
+    output = [["Character", "♥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: heartsuit; with a semi-colon" do
+    input = "&heartsuit;"
+    output = [["Character", "♥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hellip; with a semi-colon" do
+    input = "&hellip;"
+    output = [["Character", "…"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hercon; with a semi-colon" do
+    input = "&hercon;"
+    output = [["Character", "⊹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hfr; with a semi-colon" do
+    input = "&hfr;"
+    output = [["Character", "𝔥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hksearow; with a semi-colon" do
+    input = "&hksearow;"
+    output = [["Character", "⤥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hkswarow; with a semi-colon" do
+    input = "&hkswarow;"
+    output = [["Character", "⤦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hoarr; with a semi-colon" do
+    input = "&hoarr;"
+    output = [["Character", "⇿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: homtht; with a semi-colon" do
+    input = "&homtht;"
+    output = [["Character", "∻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hookleftarrow; with a semi-colon" do
+    input = "&hookleftarrow;"
+    output = [["Character", "↩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hookrightarrow; with a semi-colon" do
+    input = "&hookrightarrow;"
+    output = [["Character", "↪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hopf; with a semi-colon" do
+    input = "&hopf;"
+    output = [["Character", "𝕙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: horbar; with a semi-colon" do
+    input = "&horbar;"
+    output = [["Character", "―"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hscr; with a semi-colon" do
+    input = "&hscr;"
+    output = [["Character", "𝒽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hslash; with a semi-colon" do
+    input = "&hslash;"
+    output = [["Character", "ℏ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hstrok; with a semi-colon" do
+    input = "&hstrok;"
+    output = [["Character", "ħ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hybull; with a semi-colon" do
+    input = "&hybull;"
+    output = [["Character", "⁃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: hyphen; with a semi-colon" do
+    input = "&hyphen;"
+    output = [["Character", "‐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iacute without a semi-colon" do
+    input = "&iacute"
+    output = [["Character", "í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iacute; with a semi-colon" do
+    input = "&iacute;"
+    output = [["Character", "í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ic; with a semi-colon" do
+    input = "&ic;"
+    output = [["Character", "⁣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: icirc without a semi-colon" do
+    input = "&icirc"
+    output = [["Character", "î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: icirc; with a semi-colon" do
+    input = "&icirc;"
+    output = [["Character", "î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: icy; with a semi-colon" do
+    input = "&icy;"
+    output = [["Character", "и"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iecy; with a semi-colon" do
+    input = "&iecy;"
+    output = [["Character", "е"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iexcl without a semi-colon" do
+    input = "&iexcl"
+    output = [["Character", "¡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iexcl; with a semi-colon" do
+    input = "&iexcl;"
+    output = [["Character", "¡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iff; with a semi-colon" do
+    input = "&iff;"
+    output = [["Character", "⇔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ifr; with a semi-colon" do
+    input = "&ifr;"
+    output = [["Character", "𝔦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: igrave without a semi-colon" do
+    input = "&igrave"
+    output = [["Character", "ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: igrave; with a semi-colon" do
+    input = "&igrave;"
+    output = [["Character", "ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ii; with a semi-colon" do
+    input = "&ii;"
+    output = [["Character", "ⅈ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iiiint; with a semi-colon" do
+    input = "&iiiint;"
+    output = [["Character", "⨌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iiint; with a semi-colon" do
+    input = "&iiint;"
+    output = [["Character", "∭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iinfin; with a semi-colon" do
+    input = "&iinfin;"
+    output = [["Character", "⧜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iiota; with a semi-colon" do
+    input = "&iiota;"
+    output = [["Character", "℩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ijlig; with a semi-colon" do
+    input = "&ijlig;"
+    output = [["Character", "ĳ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: imacr; with a semi-colon" do
+    input = "&imacr;"
+    output = [["Character", "ī"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: image; with a semi-colon" do
+    input = "&image;"
+    output = [["Character", "ℑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: imagline; with a semi-colon" do
+    input = "&imagline;"
+    output = [["Character", "ℐ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: imagpart; with a semi-colon" do
+    input = "&imagpart;"
+    output = [["Character", "ℑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: imath; with a semi-colon" do
+    input = "&imath;"
+    output = [["Character", "ı"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: imof; with a semi-colon" do
+    input = "&imof;"
+    output = [["Character", "⊷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: imped; with a semi-colon" do
+    input = "&imped;"
+    output = [["Character", "Ƶ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: in; with a semi-colon" do
+    input = "&in;"
+    output = [["Character", "∈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: incare; with a semi-colon" do
+    input = "&incare;"
+    output = [["Character", "℅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: infin; with a semi-colon" do
+    input = "&infin;"
+    output = [["Character", "∞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: infintie; with a semi-colon" do
+    input = "&infintie;"
+    output = [["Character", "⧝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: inodot; with a semi-colon" do
+    input = "&inodot;"
+    output = [["Character", "ı"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: int; with a semi-colon" do
+    input = "&int;"
+    output = [["Character", "∫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: intcal; with a semi-colon" do
+    input = "&intcal;"
+    output = [["Character", "⊺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: integers; with a semi-colon" do
+    input = "&integers;"
+    output = [["Character", "ℤ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: intercal; with a semi-colon" do
+    input = "&intercal;"
+    output = [["Character", "⊺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: intlarhk; with a semi-colon" do
+    input = "&intlarhk;"
+    output = [["Character", "⨗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: intprod; with a semi-colon" do
+    input = "&intprod;"
+    output = [["Character", "⨼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iocy; with a semi-colon" do
+    input = "&iocy;"
+    output = [["Character", "ё"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iogon; with a semi-colon" do
+    input = "&iogon;"
+    output = [["Character", "į"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iopf; with a semi-colon" do
+    input = "&iopf;"
+    output = [["Character", "𝕚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iota; with a semi-colon" do
+    input = "&iota;"
+    output = [["Character", "ι"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iprod; with a semi-colon" do
+    input = "&iprod;"
+    output = [["Character", "⨼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iquest without a semi-colon" do
+    input = "&iquest"
+    output = [["Character", "¿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part33_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part33_test.exs
new file mode 100644
index 00000000..9da003f5
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part33_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart33Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: iquest; with a semi-colon" do
+    input = "&iquest;"
+    output = [["Character", "¿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iscr; with a semi-colon" do
+    input = "&iscr;"
+    output = [["Character", "𝒾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: isin; with a semi-colon" do
+    input = "&isin;"
+    output = [["Character", "∈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: isinE; with a semi-colon" do
+    input = "&isinE;"
+    output = [["Character", "⋹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: isindot; with a semi-colon" do
+    input = "&isindot;"
+    output = [["Character", "⋵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: isins; with a semi-colon" do
+    input = "&isins;"
+    output = [["Character", "⋴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: isinsv; with a semi-colon" do
+    input = "&isinsv;"
+    output = [["Character", "⋳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: isinv; with a semi-colon" do
+    input = "&isinv;"
+    output = [["Character", "∈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: it; with a semi-colon" do
+    input = "&it;"
+    output = [["Character", "⁢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: itilde; with a semi-colon" do
+    input = "&itilde;"
+    output = [["Character", "ĩ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iukcy; with a semi-colon" do
+    input = "&iukcy;"
+    output = [["Character", "і"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iuml without a semi-colon" do
+    input = "&iuml"
+    output = [["Character", "ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: iuml; with a semi-colon" do
+    input = "&iuml;"
+    output = [["Character", "ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jcirc; with a semi-colon" do
+    input = "&jcirc;"
+    output = [["Character", "ĵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jcy; with a semi-colon" do
+    input = "&jcy;"
+    output = [["Character", "й"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jfr; with a semi-colon" do
+    input = "&jfr;"
+    output = [["Character", "𝔧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jmath; with a semi-colon" do
+    input = "&jmath;"
+    output = [["Character", "ȷ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jopf; with a semi-colon" do
+    input = "&jopf;"
+    output = [["Character", "𝕛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jscr; with a semi-colon" do
+    input = "&jscr;"
+    output = [["Character", "𝒿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jsercy; with a semi-colon" do
+    input = "&jsercy;"
+    output = [["Character", "ј"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: jukcy; with a semi-colon" do
+    input = "&jukcy;"
+    output = [["Character", "є"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kappa; with a semi-colon" do
+    input = "&kappa;"
+    output = [["Character", "κ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kappav; with a semi-colon" do
+    input = "&kappav;"
+    output = [["Character", "ϰ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kcedil; with a semi-colon" do
+    input = "&kcedil;"
+    output = [["Character", "ķ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kcy; with a semi-colon" do
+    input = "&kcy;"
+    output = [["Character", "к"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kfr; with a semi-colon" do
+    input = "&kfr;"
+    output = [["Character", "𝔨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kgreen; with a semi-colon" do
+    input = "&kgreen;"
+    output = [["Character", "ĸ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: khcy; with a semi-colon" do
+    input = "&khcy;"
+    output = [["Character", "х"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kjcy; with a semi-colon" do
+    input = "&kjcy;"
+    output = [["Character", "ќ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kopf; with a semi-colon" do
+    input = "&kopf;"
+    output = [["Character", "𝕜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: kscr; with a semi-colon" do
+    input = "&kscr;"
+    output = [["Character", "𝓀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lAarr; with a semi-colon" do
+    input = "&lAarr;"
+    output = [["Character", "⇚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lArr; with a semi-colon" do
+    input = "&lArr;"
+    output = [["Character", "⇐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lAtail; with a semi-colon" do
+    input = "&lAtail;"
+    output = [["Character", "⤛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lBarr; with a semi-colon" do
+    input = "&lBarr;"
+    output = [["Character", "⤎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lE; with a semi-colon" do
+    input = "&lE;"
+    output = [["Character", "≦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lEg; with a semi-colon" do
+    input = "&lEg;"
+    output = [["Character", "⪋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lHar; with a semi-colon" do
+    input = "&lHar;"
+    output = [["Character", "⥢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lacute; with a semi-colon" do
+    input = "&lacute;"
+    output = [["Character", "ĺ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: laemptyv; with a semi-colon" do
+    input = "&laemptyv;"
+    output = [["Character", "⦴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lagran; with a semi-colon" do
+    input = "&lagran;"
+    output = [["Character", "ℒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lambda; with a semi-colon" do
+    input = "&lambda;"
+    output = [["Character", "λ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lang; with a semi-colon" do
+    input = "&lang;"
+    output = [["Character", "⟨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: langd; with a semi-colon" do
+    input = "&langd;"
+    output = [["Character", "⦑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: langle; with a semi-colon" do
+    input = "&langle;"
+    output = [["Character", "⟨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lap; with a semi-colon" do
+    input = "&lap;"
+    output = [["Character", "⪅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: laquo without a semi-colon" do
+    input = "&laquo"
+    output = [["Character", "«"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: laquo; with a semi-colon" do
+    input = "&laquo;"
+    output = [["Character", "«"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larr; with a semi-colon" do
+    input = "&larr;"
+    output = [["Character", "←"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrb; with a semi-colon" do
+    input = "&larrb;"
+    output = [["Character", "⇤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrbfs; with a semi-colon" do
+    input = "&larrbfs;"
+    output = [["Character", "⤟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrfs; with a semi-colon" do
+    input = "&larrfs;"
+    output = [["Character", "⤝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrhk; with a semi-colon" do
+    input = "&larrhk;"
+    output = [["Character", "↩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrlp; with a semi-colon" do
+    input = "&larrlp;"
+    output = [["Character", "↫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrpl; with a semi-colon" do
+    input = "&larrpl;"
+    output = [["Character", "⤹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrsim; with a semi-colon" do
+    input = "&larrsim;"
+    output = [["Character", "⥳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: larrtl; with a semi-colon" do
+    input = "&larrtl;"
+    output = [["Character", "↢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lat; with a semi-colon" do
+    input = "&lat;"
+    output = [["Character", "⪫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: latail; with a semi-colon" do
+    input = "&latail;"
+    output = [["Character", "⤙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: late; with a semi-colon" do
+    input = "&late;"
+    output = [["Character", "⪭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lates; with a semi-colon" do
+    input = "&lates;"
+    output = [["Character", "⪭︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbarr; with a semi-colon" do
+    input = "&lbarr;"
+    output = [["Character", "⤌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbbrk; with a semi-colon" do
+    input = "&lbbrk;"
+    output = [["Character", "❲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbrace; with a semi-colon" do
+    input = "&lbrace;"
+    output = [["Character", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbrack; with a semi-colon" do
+    input = "&lbrack;"
+    output = [["Character", "["]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbrke; with a semi-colon" do
+    input = "&lbrke;"
+    output = [["Character", "⦋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbrksld; with a semi-colon" do
+    input = "&lbrksld;"
+    output = [["Character", "⦏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lbrkslu; with a semi-colon" do
+    input = "&lbrkslu;"
+    output = [["Character", "⦍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lcaron; with a semi-colon" do
+    input = "&lcaron;"
+    output = [["Character", "ľ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lcedil; with a semi-colon" do
+    input = "&lcedil;"
+    output = [["Character", "ļ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lceil; with a semi-colon" do
+    input = "&lceil;"
+    output = [["Character", "⌈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lcub; with a semi-colon" do
+    input = "&lcub;"
+    output = [["Character", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lcy; with a semi-colon" do
+    input = "&lcy;"
+    output = [["Character", "л"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ldca; with a semi-colon" do
+    input = "&ldca;"
+    output = [["Character", "⤶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ldquo; with a semi-colon" do
+    input = "&ldquo;"
+    output = [["Character", "“"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ldquor; with a semi-colon" do
+    input = "&ldquor;"
+    output = [["Character", "„"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ldrdhar; with a semi-colon" do
+    input = "&ldrdhar;"
+    output = [["Character", "⥧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ldrushar; with a semi-colon" do
+    input = "&ldrushar;"
+    output = [["Character", "⥋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ldsh; with a semi-colon" do
+    input = "&ldsh;"
+    output = [["Character", "↲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: le; with a semi-colon" do
+    input = "&le;"
+    output = [["Character", "≤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftarrow; with a semi-colon" do
+    input = "&leftarrow;"
+    output = [["Character", "←"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftarrowtail; with a semi-colon" do
+    input = "&leftarrowtail;"
+    output = [["Character", "↢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftharpoondown; with a semi-colon" do
+    input = "&leftharpoondown;"
+    output = [["Character", "↽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftharpoonup; with a semi-colon" do
+    input = "&leftharpoonup;"
+    output = [["Character", "↼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftleftarrows; with a semi-colon" do
+    input = "&leftleftarrows;"
+    output = [["Character", "⇇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftrightarrow; with a semi-colon" do
+    input = "&leftrightarrow;"
+    output = [["Character", "↔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftrightarrows; with a semi-colon" do
+    input = "&leftrightarrows;"
+    output = [["Character", "⇆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftrightharpoons; with a semi-colon" do
+    input = "&leftrightharpoons;"
+    output = [["Character", "⇋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftrightsquigarrow; with a semi-colon" do
+    input = "&leftrightsquigarrow;"
+    output = [["Character", "↭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leftthreetimes; with a semi-colon" do
+    input = "&leftthreetimes;"
+    output = [["Character", "⋋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leg; with a semi-colon" do
+    input = "&leg;"
+    output = [["Character", "⋚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leq; with a semi-colon" do
+    input = "&leq;"
+    output = [["Character", "≤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leqq; with a semi-colon" do
+    input = "&leqq;"
+    output = [["Character", "≦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: leqslant; with a semi-colon" do
+    input = "&leqslant;"
+    output = [["Character", "⩽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: les; with a semi-colon" do
+    input = "&les;"
+    output = [["Character", "⩽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lescc; with a semi-colon" do
+    input = "&lescc;"
+    output = [["Character", "⪨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesdot; with a semi-colon" do
+    input = "&lesdot;"
+    output = [["Character", "⩿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesdoto; with a semi-colon" do
+    input = "&lesdoto;"
+    output = [["Character", "⪁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesdotor; with a semi-colon" do
+    input = "&lesdotor;"
+    output = [["Character", "⪃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesg; with a semi-colon" do
+    input = "&lesg;"
+    output = [["Character", "⋚︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part34_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part34_test.exs
new file mode 100644
index 00000000..66d83207
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part34_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart34Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: lesges; with a semi-colon" do
+    input = "&lesges;"
+    output = [["Character", "⪓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lessapprox; with a semi-colon" do
+    input = "&lessapprox;"
+    output = [["Character", "⪅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lessdot; with a semi-colon" do
+    input = "&lessdot;"
+    output = [["Character", "⋖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesseqgtr; with a semi-colon" do
+    input = "&lesseqgtr;"
+    output = [["Character", "⋚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesseqqgtr; with a semi-colon" do
+    input = "&lesseqqgtr;"
+    output = [["Character", "⪋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lessgtr; with a semi-colon" do
+    input = "&lessgtr;"
+    output = [["Character", "≶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lesssim; with a semi-colon" do
+    input = "&lesssim;"
+    output = [["Character", "≲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lfisht; with a semi-colon" do
+    input = "&lfisht;"
+    output = [["Character", "⥼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lfloor; with a semi-colon" do
+    input = "&lfloor;"
+    output = [["Character", "⌊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lfr; with a semi-colon" do
+    input = "&lfr;"
+    output = [["Character", "𝔩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lg; with a semi-colon" do
+    input = "&lg;"
+    output = [["Character", "≶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lgE; with a semi-colon" do
+    input = "&lgE;"
+    output = [["Character", "⪑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lhard; with a semi-colon" do
+    input = "&lhard;"
+    output = [["Character", "↽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lharu; with a semi-colon" do
+    input = "&lharu;"
+    output = [["Character", "↼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lharul; with a semi-colon" do
+    input = "&lharul;"
+    output = [["Character", "⥪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lhblk; with a semi-colon" do
+    input = "&lhblk;"
+    output = [["Character", "▄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ljcy; with a semi-colon" do
+    input = "&ljcy;"
+    output = [["Character", "љ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ll; with a semi-colon" do
+    input = "&ll;"
+    output = [["Character", "≪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: llarr; with a semi-colon" do
+    input = "&llarr;"
+    output = [["Character", "⇇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: llcorner; with a semi-colon" do
+    input = "&llcorner;"
+    output = [["Character", "⌞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: llhard; with a semi-colon" do
+    input = "&llhard;"
+    output = [["Character", "⥫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lltri; with a semi-colon" do
+    input = "&lltri;"
+    output = [["Character", "◺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lmidot; with a semi-colon" do
+    input = "&lmidot;"
+    output = [["Character", "ŀ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lmoust; with a semi-colon" do
+    input = "&lmoust;"
+    output = [["Character", "⎰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lmoustache; with a semi-colon" do
+    input = "&lmoustache;"
+    output = [["Character", "⎰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lnE; with a semi-colon" do
+    input = "&lnE;"
+    output = [["Character", "≨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lnap; with a semi-colon" do
+    input = "&lnap;"
+    output = [["Character", "⪉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lnapprox; with a semi-colon" do
+    input = "&lnapprox;"
+    output = [["Character", "⪉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lne; with a semi-colon" do
+    input = "&lne;"
+    output = [["Character", "⪇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lneq; with a semi-colon" do
+    input = "&lneq;"
+    output = [["Character", "⪇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lneqq; with a semi-colon" do
+    input = "&lneqq;"
+    output = [["Character", "≨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lnsim; with a semi-colon" do
+    input = "&lnsim;"
+    output = [["Character", "⋦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: loang; with a semi-colon" do
+    input = "&loang;"
+    output = [["Character", "⟬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: loarr; with a semi-colon" do
+    input = "&loarr;"
+    output = [["Character", "⇽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lobrk; with a semi-colon" do
+    input = "&lobrk;"
+    output = [["Character", "⟦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: longleftarrow; with a semi-colon" do
+    input = "&longleftarrow;"
+    output = [["Character", "⟵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: longleftrightarrow; with a semi-colon" do
+    input = "&longleftrightarrow;"
+    output = [["Character", "⟷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: longmapsto; with a semi-colon" do
+    input = "&longmapsto;"
+    output = [["Character", "⟼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: longrightarrow; with a semi-colon" do
+    input = "&longrightarrow;"
+    output = [["Character", "⟶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: looparrowleft; with a semi-colon" do
+    input = "&looparrowleft;"
+    output = [["Character", "↫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: looparrowright; with a semi-colon" do
+    input = "&looparrowright;"
+    output = [["Character", "↬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lopar; with a semi-colon" do
+    input = "&lopar;"
+    output = [["Character", "⦅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lopf; with a semi-colon" do
+    input = "&lopf;"
+    output = [["Character", "𝕝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: loplus; with a semi-colon" do
+    input = "&loplus;"
+    output = [["Character", "⨭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lotimes; with a semi-colon" do
+    input = "&lotimes;"
+    output = [["Character", "⨴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lowast; with a semi-colon" do
+    input = "&lowast;"
+    output = [["Character", "∗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lowbar; with a semi-colon" do
+    input = "&lowbar;"
+    output = [["Character", "_"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: loz; with a semi-colon" do
+    input = "&loz;"
+    output = [["Character", "◊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lozenge; with a semi-colon" do
+    input = "&lozenge;"
+    output = [["Character", "◊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lozf; with a semi-colon" do
+    input = "&lozf;"
+    output = [["Character", "⧫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lpar; with a semi-colon" do
+    input = "&lpar;"
+    output = [["Character", "("]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lparlt; with a semi-colon" do
+    input = "&lparlt;"
+    output = [["Character", "⦓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lrarr; with a semi-colon" do
+    input = "&lrarr;"
+    output = [["Character", "⇆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lrcorner; with a semi-colon" do
+    input = "&lrcorner;"
+    output = [["Character", "⌟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lrhar; with a semi-colon" do
+    input = "&lrhar;"
+    output = [["Character", "⇋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lrhard; with a semi-colon" do
+    input = "&lrhard;"
+    output = [["Character", "⥭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lrm; with a semi-colon" do
+    input = "&lrm;"
+    output = [["Character", "‎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lrtri; with a semi-colon" do
+    input = "&lrtri;"
+    output = [["Character", "⊿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsaquo; with a semi-colon" do
+    input = "&lsaquo;"
+    output = [["Character", "‹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lscr; with a semi-colon" do
+    input = "&lscr;"
+    output = [["Character", "𝓁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsh; with a semi-colon" do
+    input = "&lsh;"
+    output = [["Character", "↰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsim; with a semi-colon" do
+    input = "&lsim;"
+    output = [["Character", "≲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsime; with a semi-colon" do
+    input = "&lsime;"
+    output = [["Character", "⪍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsimg; with a semi-colon" do
+    input = "&lsimg;"
+    output = [["Character", "⪏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsqb; with a semi-colon" do
+    input = "&lsqb;"
+    output = [["Character", "["]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsquo; with a semi-colon" do
+    input = "&lsquo;"
+    output = [["Character", "‘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lsquor; with a semi-colon" do
+    input = "&lsquor;"
+    output = [["Character", "‚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lstrok; with a semi-colon" do
+    input = "&lstrok;"
+    output = [["Character", "ł"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lt without a semi-colon" do
+    input = "&lt"
+    output = [["Character", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lt; with a semi-colon" do
+    input = "&lt;"
+    output = [["Character", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltcc; with a semi-colon" do
+    input = "&ltcc;"
+    output = [["Character", "⪦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltcir; with a semi-colon" do
+    input = "&ltcir;"
+    output = [["Character", "⩹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltdot; with a semi-colon" do
+    input = "&ltdot;"
+    output = [["Character", "⋖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lthree; with a semi-colon" do
+    input = "&lthree;"
+    output = [["Character", "⋋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltimes; with a semi-colon" do
+    input = "&ltimes;"
+    output = [["Character", "⋉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltlarr; with a semi-colon" do
+    input = "&ltlarr;"
+    output = [["Character", "⥶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltquest; with a semi-colon" do
+    input = "&ltquest;"
+    output = [["Character", "⩻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltrPar; with a semi-colon" do
+    input = "&ltrPar;"
+    output = [["Character", "⦖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltri; with a semi-colon" do
+    input = "&ltri;"
+    output = [["Character", "◃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltrie; with a semi-colon" do
+    input = "&ltrie;"
+    output = [["Character", "⊴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ltrif; with a semi-colon" do
+    input = "&ltrif;"
+    output = [["Character", "◂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lurdshar; with a semi-colon" do
+    input = "&lurdshar;"
+    output = [["Character", "⥊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: luruhar; with a semi-colon" do
+    input = "&luruhar;"
+    output = [["Character", "⥦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lvertneqq; with a semi-colon" do
+    input = "&lvertneqq;"
+    output = [["Character", "≨︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: lvnE; with a semi-colon" do
+    input = "&lvnE;"
+    output = [["Character", "≨︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mDDot; with a semi-colon" do
+    input = "&mDDot;"
+    output = [["Character", "∺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: macr without a semi-colon" do
+    input = "&macr"
+    output = [["Character", "¯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: macr; with a semi-colon" do
+    input = "&macr;"
+    output = [["Character", "¯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: male; with a semi-colon" do
+    input = "&male;"
+    output = [["Character", "♂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: malt; with a semi-colon" do
+    input = "&malt;"
+    output = [["Character", "✠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: maltese; with a semi-colon" do
+    input = "&maltese;"
+    output = [["Character", "✠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: map; with a semi-colon" do
+    input = "&map;"
+    output = [["Character", "↦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mapsto; with a semi-colon" do
+    input = "&mapsto;"
+    output = [["Character", "↦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mapstodown; with a semi-colon" do
+    input = "&mapstodown;"
+    output = [["Character", "↧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mapstoleft; with a semi-colon" do
+    input = "&mapstoleft;"
+    output = [["Character", "↤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mapstoup; with a semi-colon" do
+    input = "&mapstoup;"
+    output = [["Character", "↥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: marker; with a semi-colon" do
+    input = "&marker;"
+    output = [["Character", "▮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mcomma; with a semi-colon" do
+    input = "&mcomma;"
+    output = [["Character", "⨩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mcy; with a semi-colon" do
+    input = "&mcy;"
+    output = [["Character", "м"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mdash; with a semi-colon" do
+    input = "&mdash;"
+    output = [["Character", "—"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part35_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part35_test.exs
new file mode 100644
index 00000000..2c84bbb8
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part35_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart35Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: measuredangle; with a semi-colon" do
+    input = "&measuredangle;"
+    output = [["Character", "∡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mfr; with a semi-colon" do
+    input = "&mfr;"
+    output = [["Character", "𝔪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mho; with a semi-colon" do
+    input = "&mho;"
+    output = [["Character", "℧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: micro without a semi-colon" do
+    input = "&micro"
+    output = [["Character", "µ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: micro; with a semi-colon" do
+    input = "&micro;"
+    output = [["Character", "µ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mid; with a semi-colon" do
+    input = "&mid;"
+    output = [["Character", "∣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: midast; with a semi-colon" do
+    input = "&midast;"
+    output = [["Character", "*"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: midcir; with a semi-colon" do
+    input = "&midcir;"
+    output = [["Character", "⫰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: middot without a semi-colon" do
+    input = "&middot"
+    output = [["Character", "·"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: middot; with a semi-colon" do
+    input = "&middot;"
+    output = [["Character", "·"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: minus; with a semi-colon" do
+    input = "&minus;"
+    output = [["Character", "−"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: minusb; with a semi-colon" do
+    input = "&minusb;"
+    output = [["Character", "⊟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: minusd; with a semi-colon" do
+    input = "&minusd;"
+    output = [["Character", "∸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: minusdu; with a semi-colon" do
+    input = "&minusdu;"
+    output = [["Character", "⨪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mlcp; with a semi-colon" do
+    input = "&mlcp;"
+    output = [["Character", "⫛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mldr; with a semi-colon" do
+    input = "&mldr;"
+    output = [["Character", "…"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mnplus; with a semi-colon" do
+    input = "&mnplus;"
+    output = [["Character", "∓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: models; with a semi-colon" do
+    input = "&models;"
+    output = [["Character", "⊧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mopf; with a semi-colon" do
+    input = "&mopf;"
+    output = [["Character", "𝕞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mp; with a semi-colon" do
+    input = "&mp;"
+    output = [["Character", "∓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mscr; with a semi-colon" do
+    input = "&mscr;"
+    output = [["Character", "𝓂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mstpos; with a semi-colon" do
+    input = "&mstpos;"
+    output = [["Character", "∾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mu; with a semi-colon" do
+    input = "&mu;"
+    output = [["Character", "μ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: multimap; with a semi-colon" do
+    input = "&multimap;"
+    output = [["Character", "⊸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: mumap; with a semi-colon" do
+    input = "&mumap;"
+    output = [["Character", "⊸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nGg; with a semi-colon" do
+    input = "&nGg;"
+    output = [["Character", "⋙̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nGt; with a semi-colon" do
+    input = "&nGt;"
+    output = [["Character", "≫⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nGtv; with a semi-colon" do
+    input = "&nGtv;"
+    output = [["Character", "≫̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nLeftarrow; with a semi-colon" do
+    input = "&nLeftarrow;"
+    output = [["Character", "⇍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nLeftrightarrow; with a semi-colon" do
+    input = "&nLeftrightarrow;"
+    output = [["Character", "⇎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nLl; with a semi-colon" do
+    input = "&nLl;"
+    output = [["Character", "⋘̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nLt; with a semi-colon" do
+    input = "&nLt;"
+    output = [["Character", "≪⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nLtv; with a semi-colon" do
+    input = "&nLtv;"
+    output = [["Character", "≪̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nRightarrow; with a semi-colon" do
+    input = "&nRightarrow;"
+    output = [["Character", "⇏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nVDash; with a semi-colon" do
+    input = "&nVDash;"
+    output = [["Character", "⊯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nVdash; with a semi-colon" do
+    input = "&nVdash;"
+    output = [["Character", "⊮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nabla; with a semi-colon" do
+    input = "&nabla;"
+    output = [["Character", "∇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nacute; with a semi-colon" do
+    input = "&nacute;"
+    output = [["Character", "ń"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nang; with a semi-colon" do
+    input = "&nang;"
+    output = [["Character", "∠⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nap; with a semi-colon" do
+    input = "&nap;"
+    output = [["Character", "≉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: napE; with a semi-colon" do
+    input = "&napE;"
+    output = [["Character", "⩰̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: napid; with a semi-colon" do
+    input = "&napid;"
+    output = [["Character", "≋̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: napos; with a semi-colon" do
+    input = "&napos;"
+    output = [["Character", "ŉ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: napprox; with a semi-colon" do
+    input = "&napprox;"
+    output = [["Character", "≉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: natur; with a semi-colon" do
+    input = "&natur;"
+    output = [["Character", "♮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: natural; with a semi-colon" do
+    input = "&natural;"
+    output = [["Character", "♮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: naturals; with a semi-colon" do
+    input = "&naturals;"
+    output = [["Character", "ℕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nbsp without a semi-colon" do
+    input = "&nbsp"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nbsp; with a semi-colon" do
+    input = "&nbsp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nbump; with a semi-colon" do
+    input = "&nbump;"
+    output = [["Character", "≎̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nbumpe; with a semi-colon" do
+    input = "&nbumpe;"
+    output = [["Character", "≏̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncap; with a semi-colon" do
+    input = "&ncap;"
+    output = [["Character", "⩃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncaron; with a semi-colon" do
+    input = "&ncaron;"
+    output = [["Character", "ň"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncedil; with a semi-colon" do
+    input = "&ncedil;"
+    output = [["Character", "ņ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncong; with a semi-colon" do
+    input = "&ncong;"
+    output = [["Character", "≇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncongdot; with a semi-colon" do
+    input = "&ncongdot;"
+    output = [["Character", "⩭̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncup; with a semi-colon" do
+    input = "&ncup;"
+    output = [["Character", "⩂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ncy; with a semi-colon" do
+    input = "&ncy;"
+    output = [["Character", "н"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ndash; with a semi-colon" do
+    input = "&ndash;"
+    output = [["Character", "–"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ne; with a semi-colon" do
+    input = "&ne;"
+    output = [["Character", "≠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: neArr; with a semi-colon" do
+    input = "&neArr;"
+    output = [["Character", "⇗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nearhk; with a semi-colon" do
+    input = "&nearhk;"
+    output = [["Character", "⤤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nearr; with a semi-colon" do
+    input = "&nearr;"
+    output = [["Character", "↗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nearrow; with a semi-colon" do
+    input = "&nearrow;"
+    output = [["Character", "↗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nedot; with a semi-colon" do
+    input = "&nedot;"
+    output = [["Character", "≐̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nequiv; with a semi-colon" do
+    input = "&nequiv;"
+    output = [["Character", "≢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nesear; with a semi-colon" do
+    input = "&nesear;"
+    output = [["Character", "⤨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nesim; with a semi-colon" do
+    input = "&nesim;"
+    output = [["Character", "≂̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nexist; with a semi-colon" do
+    input = "&nexist;"
+    output = [["Character", "∄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nexists; with a semi-colon" do
+    input = "&nexists;"
+    output = [["Character", "∄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nfr; with a semi-colon" do
+    input = "&nfr;"
+    output = [["Character", "𝔫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngE; with a semi-colon" do
+    input = "&ngE;"
+    output = [["Character", "≧̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nge; with a semi-colon" do
+    input = "&nge;"
+    output = [["Character", "≱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngeq; with a semi-colon" do
+    input = "&ngeq;"
+    output = [["Character", "≱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngeqq; with a semi-colon" do
+    input = "&ngeqq;"
+    output = [["Character", "≧̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngeqslant; with a semi-colon" do
+    input = "&ngeqslant;"
+    output = [["Character", "⩾̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nges; with a semi-colon" do
+    input = "&nges;"
+    output = [["Character", "⩾̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngsim; with a semi-colon" do
+    input = "&ngsim;"
+    output = [["Character", "≵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngt; with a semi-colon" do
+    input = "&ngt;"
+    output = [["Character", "≯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ngtr; with a semi-colon" do
+    input = "&ngtr;"
+    output = [["Character", "≯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nhArr; with a semi-colon" do
+    input = "&nhArr;"
+    output = [["Character", "⇎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nharr; with a semi-colon" do
+    input = "&nharr;"
+    output = [["Character", "↮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nhpar; with a semi-colon" do
+    input = "&nhpar;"
+    output = [["Character", "⫲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ni; with a semi-colon" do
+    input = "&ni;"
+    output = [["Character", "∋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nis; with a semi-colon" do
+    input = "&nis;"
+    output = [["Character", "⋼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nisd; with a semi-colon" do
+    input = "&nisd;"
+    output = [["Character", "⋺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: niv; with a semi-colon" do
+    input = "&niv;"
+    output = [["Character", "∋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: njcy; with a semi-colon" do
+    input = "&njcy;"
+    output = [["Character", "њ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nlArr; with a semi-colon" do
+    input = "&nlArr;"
+    output = [["Character", "⇍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nlE; with a semi-colon" do
+    input = "&nlE;"
+    output = [["Character", "≦̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nlarr; with a semi-colon" do
+    input = "&nlarr;"
+    output = [["Character", "↚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nldr; with a semi-colon" do
+    input = "&nldr;"
+    output = [["Character", "‥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nle; with a semi-colon" do
+    input = "&nle;"
+    output = [["Character", "≰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nleftarrow; with a semi-colon" do
+    input = "&nleftarrow;"
+    output = [["Character", "↚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nleftrightarrow; with a semi-colon" do
+    input = "&nleftrightarrow;"
+    output = [["Character", "↮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nleq; with a semi-colon" do
+    input = "&nleq;"
+    output = [["Character", "≰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nleqq; with a semi-colon" do
+    input = "&nleqq;"
+    output = [["Character", "≦̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nleqslant; with a semi-colon" do
+    input = "&nleqslant;"
+    output = [["Character", "⩽̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nles; with a semi-colon" do
+    input = "&nles;"
+    output = [["Character", "⩽̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nless; with a semi-colon" do
+    input = "&nless;"
+    output = [["Character", "≮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part36_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part36_test.exs
new file mode 100644
index 00000000..ae9d9206
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part36_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart36Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: nlsim; with a semi-colon" do
+    input = "&nlsim;"
+    output = [["Character", "≴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nlt; with a semi-colon" do
+    input = "&nlt;"
+    output = [["Character", "≮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nltri; with a semi-colon" do
+    input = "&nltri;"
+    output = [["Character", "⋪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nltrie; with a semi-colon" do
+    input = "&nltrie;"
+    output = [["Character", "⋬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nmid; with a semi-colon" do
+    input = "&nmid;"
+    output = [["Character", "∤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nopf; with a semi-colon" do
+    input = "&nopf;"
+    output = [["Character", "𝕟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: not without a semi-colon" do
+    input = "&not"
+    output = [["Character", "¬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: not; with a semi-colon" do
+    input = "&not;"
+    output = [["Character", "¬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notin; with a semi-colon" do
+    input = "&notin;"
+    output = [["Character", "∉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notinE; with a semi-colon" do
+    input = "&notinE;"
+    output = [["Character", "⋹̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notindot; with a semi-colon" do
+    input = "&notindot;"
+    output = [["Character", "⋵̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notinva; with a semi-colon" do
+    input = "&notinva;"
+    output = [["Character", "∉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notinvb; with a semi-colon" do
+    input = "&notinvb;"
+    output = [["Character", "⋷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notinvc; with a semi-colon" do
+    input = "&notinvc;"
+    output = [["Character", "⋶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notni; with a semi-colon" do
+    input = "&notni;"
+    output = [["Character", "∌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notniva; with a semi-colon" do
+    input = "&notniva;"
+    output = [["Character", "∌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notnivb; with a semi-colon" do
+    input = "&notnivb;"
+    output = [["Character", "⋾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: notnivc; with a semi-colon" do
+    input = "&notnivc;"
+    output = [["Character", "⋽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: npar; with a semi-colon" do
+    input = "&npar;"
+    output = [["Character", "∦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nparallel; with a semi-colon" do
+    input = "&nparallel;"
+    output = [["Character", "∦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nparsl; with a semi-colon" do
+    input = "&nparsl;"
+    output = [["Character", "⫽⃥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: npart; with a semi-colon" do
+    input = "&npart;"
+    output = [["Character", "∂̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: npolint; with a semi-colon" do
+    input = "&npolint;"
+    output = [["Character", "⨔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: npr; with a semi-colon" do
+    input = "&npr;"
+    output = [["Character", "⊀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nprcue; with a semi-colon" do
+    input = "&nprcue;"
+    output = [["Character", "⋠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: npre; with a semi-colon" do
+    input = "&npre;"
+    output = [["Character", "⪯̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nprec; with a semi-colon" do
+    input = "&nprec;"
+    output = [["Character", "⊀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: npreceq; with a semi-colon" do
+    input = "&npreceq;"
+    output = [["Character", "⪯̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrArr; with a semi-colon" do
+    input = "&nrArr;"
+    output = [["Character", "⇏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrarr; with a semi-colon" do
+    input = "&nrarr;"
+    output = [["Character", "↛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrarrc; with a semi-colon" do
+    input = "&nrarrc;"
+    output = [["Character", "⤳̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrarrw; with a semi-colon" do
+    input = "&nrarrw;"
+    output = [["Character", "↝̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrightarrow; with a semi-colon" do
+    input = "&nrightarrow;"
+    output = [["Character", "↛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrtri; with a semi-colon" do
+    input = "&nrtri;"
+    output = [["Character", "⋫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nrtrie; with a semi-colon" do
+    input = "&nrtrie;"
+    output = [["Character", "⋭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsc; with a semi-colon" do
+    input = "&nsc;"
+    output = [["Character", "⊁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsccue; with a semi-colon" do
+    input = "&nsccue;"
+    output = [["Character", "⋡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsce; with a semi-colon" do
+    input = "&nsce;"
+    output = [["Character", "⪰̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nscr; with a semi-colon" do
+    input = "&nscr;"
+    output = [["Character", "𝓃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nshortmid; with a semi-colon" do
+    input = "&nshortmid;"
+    output = [["Character", "∤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nshortparallel; with a semi-colon" do
+    input = "&nshortparallel;"
+    output = [["Character", "∦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsim; with a semi-colon" do
+    input = "&nsim;"
+    output = [["Character", "≁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsime; with a semi-colon" do
+    input = "&nsime;"
+    output = [["Character", "≄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsimeq; with a semi-colon" do
+    input = "&nsimeq;"
+    output = [["Character", "≄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsmid; with a semi-colon" do
+    input = "&nsmid;"
+    output = [["Character", "∤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nspar; with a semi-colon" do
+    input = "&nspar;"
+    output = [["Character", "∦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsqsube; with a semi-colon" do
+    input = "&nsqsube;"
+    output = [["Character", "⋢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsqsupe; with a semi-colon" do
+    input = "&nsqsupe;"
+    output = [["Character", "⋣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsub; with a semi-colon" do
+    input = "&nsub;"
+    output = [["Character", "⊄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsubE; with a semi-colon" do
+    input = "&nsubE;"
+    output = [["Character", "⫅̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsube; with a semi-colon" do
+    input = "&nsube;"
+    output = [["Character", "⊈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsubset; with a semi-colon" do
+    input = "&nsubset;"
+    output = [["Character", "⊂⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsubseteq; with a semi-colon" do
+    input = "&nsubseteq;"
+    output = [["Character", "⊈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsubseteqq; with a semi-colon" do
+    input = "&nsubseteqq;"
+    output = [["Character", "⫅̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsucc; with a semi-colon" do
+    input = "&nsucc;"
+    output = [["Character", "⊁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsucceq; with a semi-colon" do
+    input = "&nsucceq;"
+    output = [["Character", "⪰̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsup; with a semi-colon" do
+    input = "&nsup;"
+    output = [["Character", "⊅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsupE; with a semi-colon" do
+    input = "&nsupE;"
+    output = [["Character", "⫆̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsupe; with a semi-colon" do
+    input = "&nsupe;"
+    output = [["Character", "⊉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsupset; with a semi-colon" do
+    input = "&nsupset;"
+    output = [["Character", "⊃⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsupseteq; with a semi-colon" do
+    input = "&nsupseteq;"
+    output = [["Character", "⊉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nsupseteqq; with a semi-colon" do
+    input = "&nsupseteqq;"
+    output = [["Character", "⫆̸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntgl; with a semi-colon" do
+    input = "&ntgl;"
+    output = [["Character", "≹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntilde without a semi-colon" do
+    input = "&ntilde"
+    output = [["Character", "ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntilde; with a semi-colon" do
+    input = "&ntilde;"
+    output = [["Character", "ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntlg; with a semi-colon" do
+    input = "&ntlg;"
+    output = [["Character", "≸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntriangleleft; with a semi-colon" do
+    input = "&ntriangleleft;"
+    output = [["Character", "⋪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntrianglelefteq; with a semi-colon" do
+    input = "&ntrianglelefteq;"
+    output = [["Character", "⋬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntriangleright; with a semi-colon" do
+    input = "&ntriangleright;"
+    output = [["Character", "⋫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ntrianglerighteq; with a semi-colon" do
+    input = "&ntrianglerighteq;"
+    output = [["Character", "⋭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nu; with a semi-colon" do
+    input = "&nu;"
+    output = [["Character", "ν"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: num; with a semi-colon" do
+    input = "&num;"
+    output = [["Character", "#"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: numero; with a semi-colon" do
+    input = "&numero;"
+    output = [["Character", "№"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: numsp; with a semi-colon" do
+    input = "&numsp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvDash; with a semi-colon" do
+    input = "&nvDash;"
+    output = [["Character", "⊭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvHarr; with a semi-colon" do
+    input = "&nvHarr;"
+    output = [["Character", "⤄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvap; with a semi-colon" do
+    input = "&nvap;"
+    output = [["Character", "≍⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvdash; with a semi-colon" do
+    input = "&nvdash;"
+    output = [["Character", "⊬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvge; with a semi-colon" do
+    input = "&nvge;"
+    output = [["Character", "≥⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvgt; with a semi-colon" do
+    input = "&nvgt;"
+    output = [["Character", ">⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvinfin; with a semi-colon" do
+    input = "&nvinfin;"
+    output = [["Character", "⧞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvlArr; with a semi-colon" do
+    input = "&nvlArr;"
+    output = [["Character", "⤂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvle; with a semi-colon" do
+    input = "&nvle;"
+    output = [["Character", "≤⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvlt; with a semi-colon" do
+    input = "&nvlt;"
+    output = [["Character", "<⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvltrie; with a semi-colon" do
+    input = "&nvltrie;"
+    output = [["Character", "⊴⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvrArr; with a semi-colon" do
+    input = "&nvrArr;"
+    output = [["Character", "⤃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvrtrie; with a semi-colon" do
+    input = "&nvrtrie;"
+    output = [["Character", "⊵⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nvsim; with a semi-colon" do
+    input = "&nvsim;"
+    output = [["Character", "∼⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nwArr; with a semi-colon" do
+    input = "&nwArr;"
+    output = [["Character", "⇖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nwarhk; with a semi-colon" do
+    input = "&nwarhk;"
+    output = [["Character", "⤣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nwarr; with a semi-colon" do
+    input = "&nwarr;"
+    output = [["Character", "↖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nwarrow; with a semi-colon" do
+    input = "&nwarrow;"
+    output = [["Character", "↖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: nwnear; with a semi-colon" do
+    input = "&nwnear;"
+    output = [["Character", "⤧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oS; with a semi-colon" do
+    input = "&oS;"
+    output = [["Character", "Ⓢ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oacute without a semi-colon" do
+    input = "&oacute"
+    output = [["Character", "ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oacute; with a semi-colon" do
+    input = "&oacute;"
+    output = [["Character", "ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oast; with a semi-colon" do
+    input = "&oast;"
+    output = [["Character", "⊛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ocir; with a semi-colon" do
+    input = "&ocir;"
+    output = [["Character", "⊚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ocirc without a semi-colon" do
+    input = "&ocirc"
+    output = [["Character", "ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ocirc; with a semi-colon" do
+    input = "&ocirc;"
+    output = [["Character", "ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part37_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part37_test.exs
new file mode 100644
index 00000000..8e0daa22
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part37_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart37Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: ocy; with a semi-colon" do
+    input = "&ocy;"
+    output = [["Character", "о"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: odash; with a semi-colon" do
+    input = "&odash;"
+    output = [["Character", "⊝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: odblac; with a semi-colon" do
+    input = "&odblac;"
+    output = [["Character", "ő"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: odiv; with a semi-colon" do
+    input = "&odiv;"
+    output = [["Character", "⨸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: odot; with a semi-colon" do
+    input = "&odot;"
+    output = [["Character", "⊙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: odsold; with a semi-colon" do
+    input = "&odsold;"
+    output = [["Character", "⦼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oelig; with a semi-colon" do
+    input = "&oelig;"
+    output = [["Character", "œ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ofcir; with a semi-colon" do
+    input = "&ofcir;"
+    output = [["Character", "⦿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ofr; with a semi-colon" do
+    input = "&ofr;"
+    output = [["Character", "𝔬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ogon; with a semi-colon" do
+    input = "&ogon;"
+    output = [["Character", "˛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ograve without a semi-colon" do
+    input = "&ograve"
+    output = [["Character", "ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ograve; with a semi-colon" do
+    input = "&ograve;"
+    output = [["Character", "ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ogt; with a semi-colon" do
+    input = "&ogt;"
+    output = [["Character", "⧁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ohbar; with a semi-colon" do
+    input = "&ohbar;"
+    output = [["Character", "⦵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ohm; with a semi-colon" do
+    input = "&ohm;"
+    output = [["Character", "Ω"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oint; with a semi-colon" do
+    input = "&oint;"
+    output = [["Character", "∮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: olarr; with a semi-colon" do
+    input = "&olarr;"
+    output = [["Character", "↺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: olcir; with a semi-colon" do
+    input = "&olcir;"
+    output = [["Character", "⦾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: olcross; with a semi-colon" do
+    input = "&olcross;"
+    output = [["Character", "⦻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oline; with a semi-colon" do
+    input = "&oline;"
+    output = [["Character", "‾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: olt; with a semi-colon" do
+    input = "&olt;"
+    output = [["Character", "⧀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: omacr; with a semi-colon" do
+    input = "&omacr;"
+    output = [["Character", "ō"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: omega; with a semi-colon" do
+    input = "&omega;"
+    output = [["Character", "ω"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: omicron; with a semi-colon" do
+    input = "&omicron;"
+    output = [["Character", "ο"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: omid; with a semi-colon" do
+    input = "&omid;"
+    output = [["Character", "⦶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ominus; with a semi-colon" do
+    input = "&ominus;"
+    output = [["Character", "⊖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oopf; with a semi-colon" do
+    input = "&oopf;"
+    output = [["Character", "𝕠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: opar; with a semi-colon" do
+    input = "&opar;"
+    output = [["Character", "⦷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: operp; with a semi-colon" do
+    input = "&operp;"
+    output = [["Character", "⦹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oplus; with a semi-colon" do
+    input = "&oplus;"
+    output = [["Character", "⊕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: or; with a semi-colon" do
+    input = "&or;"
+    output = [["Character", "∨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: orarr; with a semi-colon" do
+    input = "&orarr;"
+    output = [["Character", "↻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ord; with a semi-colon" do
+    input = "&ord;"
+    output = [["Character", "⩝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: order; with a semi-colon" do
+    input = "&order;"
+    output = [["Character", "ℴ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: orderof; with a semi-colon" do
+    input = "&orderof;"
+    output = [["Character", "ℴ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ordf without a semi-colon" do
+    input = "&ordf"
+    output = [["Character", "ª"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ordf; with a semi-colon" do
+    input = "&ordf;"
+    output = [["Character", "ª"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ordm without a semi-colon" do
+    input = "&ordm"
+    output = [["Character", "º"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ordm; with a semi-colon" do
+    input = "&ordm;"
+    output = [["Character", "º"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: origof; with a semi-colon" do
+    input = "&origof;"
+    output = [["Character", "⊶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oror; with a semi-colon" do
+    input = "&oror;"
+    output = [["Character", "⩖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: orslope; with a semi-colon" do
+    input = "&orslope;"
+    output = [["Character", "⩗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: orv; with a semi-colon" do
+    input = "&orv;"
+    output = [["Character", "⩛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oscr; with a semi-colon" do
+    input = "&oscr;"
+    output = [["Character", "ℴ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oslash without a semi-colon" do
+    input = "&oslash"
+    output = [["Character", "ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: oslash; with a semi-colon" do
+    input = "&oslash;"
+    output = [["Character", "ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: osol; with a semi-colon" do
+    input = "&osol;"
+    output = [["Character", "⊘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: otilde without a semi-colon" do
+    input = "&otilde"
+    output = [["Character", "õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: otilde; with a semi-colon" do
+    input = "&otilde;"
+    output = [["Character", "õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: otimes; with a semi-colon" do
+    input = "&otimes;"
+    output = [["Character", "⊗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: otimesas; with a semi-colon" do
+    input = "&otimesas;"
+    output = [["Character", "⨶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ouml without a semi-colon" do
+    input = "&ouml"
+    output = [["Character", "ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ouml; with a semi-colon" do
+    input = "&ouml;"
+    output = [["Character", "ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ovbar; with a semi-colon" do
+    input = "&ovbar;"
+    output = [["Character", "⌽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: par; with a semi-colon" do
+    input = "&par;"
+    output = [["Character", "∥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: para without a semi-colon" do
+    input = "&para"
+    output = [["Character", "¶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: para; with a semi-colon" do
+    input = "&para;"
+    output = [["Character", "¶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: parallel; with a semi-colon" do
+    input = "&parallel;"
+    output = [["Character", "∥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: parsim; with a semi-colon" do
+    input = "&parsim;"
+    output = [["Character", "⫳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: parsl; with a semi-colon" do
+    input = "&parsl;"
+    output = [["Character", "⫽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: part; with a semi-colon" do
+    input = "&part;"
+    output = [["Character", "∂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pcy; with a semi-colon" do
+    input = "&pcy;"
+    output = [["Character", "п"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: percnt; with a semi-colon" do
+    input = "&percnt;"
+    output = [["Character", "%"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: period; with a semi-colon" do
+    input = "&period;"
+    output = [["Character", "."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: permil; with a semi-colon" do
+    input = "&permil;"
+    output = [["Character", "‰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: perp; with a semi-colon" do
+    input = "&perp;"
+    output = [["Character", "⊥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pertenk; with a semi-colon" do
+    input = "&pertenk;"
+    output = [["Character", "‱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pfr; with a semi-colon" do
+    input = "&pfr;"
+    output = [["Character", "𝔭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: phi; with a semi-colon" do
+    input = "&phi;"
+    output = [["Character", "φ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: phiv; with a semi-colon" do
+    input = "&phiv;"
+    output = [["Character", "ϕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: phmmat; with a semi-colon" do
+    input = "&phmmat;"
+    output = [["Character", "ℳ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: phone; with a semi-colon" do
+    input = "&phone;"
+    output = [["Character", "☎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pi; with a semi-colon" do
+    input = "&pi;"
+    output = [["Character", "π"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pitchfork; with a semi-colon" do
+    input = "&pitchfork;"
+    output = [["Character", "⋔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: piv; with a semi-colon" do
+    input = "&piv;"
+    output = [["Character", "ϖ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: planck; with a semi-colon" do
+    input = "&planck;"
+    output = [["Character", "ℏ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: planckh; with a semi-colon" do
+    input = "&planckh;"
+    output = [["Character", "ℎ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plankv; with a semi-colon" do
+    input = "&plankv;"
+    output = [["Character", "ℏ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plus; with a semi-colon" do
+    input = "&plus;"
+    output = [["Character", "+"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plusacir; with a semi-colon" do
+    input = "&plusacir;"
+    output = [["Character", "⨣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plusb; with a semi-colon" do
+    input = "&plusb;"
+    output = [["Character", "⊞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pluscir; with a semi-colon" do
+    input = "&pluscir;"
+    output = [["Character", "⨢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plusdo; with a semi-colon" do
+    input = "&plusdo;"
+    output = [["Character", "∔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plusdu; with a semi-colon" do
+    input = "&plusdu;"
+    output = [["Character", "⨥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pluse; with a semi-colon" do
+    input = "&pluse;"
+    output = [["Character", "⩲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plusmn without a semi-colon" do
+    input = "&plusmn"
+    output = [["Character", "±"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plusmn; with a semi-colon" do
+    input = "&plusmn;"
+    output = [["Character", "±"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plussim; with a semi-colon" do
+    input = "&plussim;"
+    output = [["Character", "⨦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: plustwo; with a semi-colon" do
+    input = "&plustwo;"
+    output = [["Character", "⨧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pm; with a semi-colon" do
+    input = "&pm;"
+    output = [["Character", "±"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pointint; with a semi-colon" do
+    input = "&pointint;"
+    output = [["Character", "⨕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: popf; with a semi-colon" do
+    input = "&popf;"
+    output = [["Character", "𝕡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pound without a semi-colon" do
+    input = "&pound"
+    output = [["Character", "£"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pound; with a semi-colon" do
+    input = "&pound;"
+    output = [["Character", "£"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pr; with a semi-colon" do
+    input = "&pr;"
+    output = [["Character", "≺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prE; with a semi-colon" do
+    input = "&prE;"
+    output = [["Character", "⪳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prap; with a semi-colon" do
+    input = "&prap;"
+    output = [["Character", "⪷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prcue; with a semi-colon" do
+    input = "&prcue;"
+    output = [["Character", "≼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pre; with a semi-colon" do
+    input = "&pre;"
+    output = [["Character", "⪯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prec; with a semi-colon" do
+    input = "&prec;"
+    output = [["Character", "≺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part38_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part38_test.exs
new file mode 100644
index 00000000..15883279
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part38_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart38Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: precapprox; with a semi-colon" do
+    input = "&precapprox;"
+    output = [["Character", "⪷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: preccurlyeq; with a semi-colon" do
+    input = "&preccurlyeq;"
+    output = [["Character", "≼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: preceq; with a semi-colon" do
+    input = "&preceq;"
+    output = [["Character", "⪯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: precnapprox; with a semi-colon" do
+    input = "&precnapprox;"
+    output = [["Character", "⪹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: precneqq; with a semi-colon" do
+    input = "&precneqq;"
+    output = [["Character", "⪵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: precnsim; with a semi-colon" do
+    input = "&precnsim;"
+    output = [["Character", "⋨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: precsim; with a semi-colon" do
+    input = "&precsim;"
+    output = [["Character", "≾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prime; with a semi-colon" do
+    input = "&prime;"
+    output = [["Character", "′"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: primes; with a semi-colon" do
+    input = "&primes;"
+    output = [["Character", "ℙ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prnE; with a semi-colon" do
+    input = "&prnE;"
+    output = [["Character", "⪵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prnap; with a semi-colon" do
+    input = "&prnap;"
+    output = [["Character", "⪹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prnsim; with a semi-colon" do
+    input = "&prnsim;"
+    output = [["Character", "⋨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prod; with a semi-colon" do
+    input = "&prod;"
+    output = [["Character", "∏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: profalar; with a semi-colon" do
+    input = "&profalar;"
+    output = [["Character", "⌮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: profline; with a semi-colon" do
+    input = "&profline;"
+    output = [["Character", "⌒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: profsurf; with a semi-colon" do
+    input = "&profsurf;"
+    output = [["Character", "⌓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prop; with a semi-colon" do
+    input = "&prop;"
+    output = [["Character", "∝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: propto; with a semi-colon" do
+    input = "&propto;"
+    output = [["Character", "∝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prsim; with a semi-colon" do
+    input = "&prsim;"
+    output = [["Character", "≾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: prurel; with a semi-colon" do
+    input = "&prurel;"
+    output = [["Character", "⊰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: pscr; with a semi-colon" do
+    input = "&pscr;"
+    output = [["Character", "𝓅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: psi; with a semi-colon" do
+    input = "&psi;"
+    output = [["Character", "ψ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: puncsp; with a semi-colon" do
+    input = "&puncsp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: qfr; with a semi-colon" do
+    input = "&qfr;"
+    output = [["Character", "𝔮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: qint; with a semi-colon" do
+    input = "&qint;"
+    output = [["Character", "⨌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: qopf; with a semi-colon" do
+    input = "&qopf;"
+    output = [["Character", "𝕢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: qprime; with a semi-colon" do
+    input = "&qprime;"
+    output = [["Character", "⁗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: qscr; with a semi-colon" do
+    input = "&qscr;"
+    output = [["Character", "𝓆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: quaternions; with a semi-colon" do
+    input = "&quaternions;"
+    output = [["Character", "ℍ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: quatint; with a semi-colon" do
+    input = "&quatint;"
+    output = [["Character", "⨖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: quest; with a semi-colon" do
+    input = "&quest;"
+    output = [["Character", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: questeq; with a semi-colon" do
+    input = "&questeq;"
+    output = [["Character", "≟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: quot without a semi-colon" do
+    input = "&quot"
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: quot; with a semi-colon" do
+    input = "&quot;"
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rAarr; with a semi-colon" do
+    input = "&rAarr;"
+    output = [["Character", "⇛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rArr; with a semi-colon" do
+    input = "&rArr;"
+    output = [["Character", "⇒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rAtail; with a semi-colon" do
+    input = "&rAtail;"
+    output = [["Character", "⤜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rBarr; with a semi-colon" do
+    input = "&rBarr;"
+    output = [["Character", "⤏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rHar; with a semi-colon" do
+    input = "&rHar;"
+    output = [["Character", "⥤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: race; with a semi-colon" do
+    input = "&race;"
+    output = [["Character", "∽̱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: racute; with a semi-colon" do
+    input = "&racute;"
+    output = [["Character", "ŕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: radic; with a semi-colon" do
+    input = "&radic;"
+    output = [["Character", "√"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: raemptyv; with a semi-colon" do
+    input = "&raemptyv;"
+    output = [["Character", "⦳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rang; with a semi-colon" do
+    input = "&rang;"
+    output = [["Character", "⟩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rangd; with a semi-colon" do
+    input = "&rangd;"
+    output = [["Character", "⦒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: range; with a semi-colon" do
+    input = "&range;"
+    output = [["Character", "⦥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rangle; with a semi-colon" do
+    input = "&rangle;"
+    output = [["Character", "⟩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: raquo without a semi-colon" do
+    input = "&raquo"
+    output = [["Character", "»"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: raquo; with a semi-colon" do
+    input = "&raquo;"
+    output = [["Character", "»"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarr; with a semi-colon" do
+    input = "&rarr;"
+    output = [["Character", "→"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrap; with a semi-colon" do
+    input = "&rarrap;"
+    output = [["Character", "⥵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrb; with a semi-colon" do
+    input = "&rarrb;"
+    output = [["Character", "⇥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrbfs; with a semi-colon" do
+    input = "&rarrbfs;"
+    output = [["Character", "⤠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrc; with a semi-colon" do
+    input = "&rarrc;"
+    output = [["Character", "⤳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrfs; with a semi-colon" do
+    input = "&rarrfs;"
+    output = [["Character", "⤞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrhk; with a semi-colon" do
+    input = "&rarrhk;"
+    output = [["Character", "↪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrlp; with a semi-colon" do
+    input = "&rarrlp;"
+    output = [["Character", "↬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrpl; with a semi-colon" do
+    input = "&rarrpl;"
+    output = [["Character", "⥅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrsim; with a semi-colon" do
+    input = "&rarrsim;"
+    output = [["Character", "⥴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrtl; with a semi-colon" do
+    input = "&rarrtl;"
+    output = [["Character", "↣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rarrw; with a semi-colon" do
+    input = "&rarrw;"
+    output = [["Character", "↝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ratail; with a semi-colon" do
+    input = "&ratail;"
+    output = [["Character", "⤚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ratio; with a semi-colon" do
+    input = "&ratio;"
+    output = [["Character", "∶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rationals; with a semi-colon" do
+    input = "&rationals;"
+    output = [["Character", "ℚ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbarr; with a semi-colon" do
+    input = "&rbarr;"
+    output = [["Character", "⤍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbbrk; with a semi-colon" do
+    input = "&rbbrk;"
+    output = [["Character", "❳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbrace; with a semi-colon" do
+    input = "&rbrace;"
+    output = [["Character", "}"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbrack; with a semi-colon" do
+    input = "&rbrack;"
+    output = [["Character", "]"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbrke; with a semi-colon" do
+    input = "&rbrke;"
+    output = [["Character", "⦌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbrksld; with a semi-colon" do
+    input = "&rbrksld;"
+    output = [["Character", "⦎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rbrkslu; with a semi-colon" do
+    input = "&rbrkslu;"
+    output = [["Character", "⦐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rcaron; with a semi-colon" do
+    input = "&rcaron;"
+    output = [["Character", "ř"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rcedil; with a semi-colon" do
+    input = "&rcedil;"
+    output = [["Character", "ŗ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rceil; with a semi-colon" do
+    input = "&rceil;"
+    output = [["Character", "⌉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rcub; with a semi-colon" do
+    input = "&rcub;"
+    output = [["Character", "}"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rcy; with a semi-colon" do
+    input = "&rcy;"
+    output = [["Character", "р"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rdca; with a semi-colon" do
+    input = "&rdca;"
+    output = [["Character", "⤷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rdldhar; with a semi-colon" do
+    input = "&rdldhar;"
+    output = [["Character", "⥩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rdquo; with a semi-colon" do
+    input = "&rdquo;"
+    output = [["Character", "”"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rdquor; with a semi-colon" do
+    input = "&rdquor;"
+    output = [["Character", "”"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rdsh; with a semi-colon" do
+    input = "&rdsh;"
+    output = [["Character", "↳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: real; with a semi-colon" do
+    input = "&real;"
+    output = [["Character", "ℜ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: realine; with a semi-colon" do
+    input = "&realine;"
+    output = [["Character", "ℛ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: realpart; with a semi-colon" do
+    input = "&realpart;"
+    output = [["Character", "ℜ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: reals; with a semi-colon" do
+    input = "&reals;"
+    output = [["Character", "ℝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rect; with a semi-colon" do
+    input = "&rect;"
+    output = [["Character", "▭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: reg without a semi-colon" do
+    input = "&reg"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: reg; with a semi-colon" do
+    input = "&reg;"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rfisht; with a semi-colon" do
+    input = "&rfisht;"
+    output = [["Character", "⥽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rfloor; with a semi-colon" do
+    input = "&rfloor;"
+    output = [["Character", "⌋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rfr; with a semi-colon" do
+    input = "&rfr;"
+    output = [["Character", "𝔯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rhard; with a semi-colon" do
+    input = "&rhard;"
+    output = [["Character", "⇁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rharu; with a semi-colon" do
+    input = "&rharu;"
+    output = [["Character", "⇀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rharul; with a semi-colon" do
+    input = "&rharul;"
+    output = [["Character", "⥬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rho; with a semi-colon" do
+    input = "&rho;"
+    output = [["Character", "ρ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rhov; with a semi-colon" do
+    input = "&rhov;"
+    output = [["Character", "ϱ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightarrow; with a semi-colon" do
+    input = "&rightarrow;"
+    output = [["Character", "→"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightarrowtail; with a semi-colon" do
+    input = "&rightarrowtail;"
+    output = [["Character", "↣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightharpoondown; with a semi-colon" do
+    input = "&rightharpoondown;"
+    output = [["Character", "⇁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightharpoonup; with a semi-colon" do
+    input = "&rightharpoonup;"
+    output = [["Character", "⇀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part39_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part39_test.exs
new file mode 100644
index 00000000..b9ccdcd7
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part39_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart39Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: rightleftarrows; with a semi-colon" do
+    input = "&rightleftarrows;"
+    output = [["Character", "⇄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightleftharpoons; with a semi-colon" do
+    input = "&rightleftharpoons;"
+    output = [["Character", "⇌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightrightarrows; with a semi-colon" do
+    input = "&rightrightarrows;"
+    output = [["Character", "⇉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightsquigarrow; with a semi-colon" do
+    input = "&rightsquigarrow;"
+    output = [["Character", "↝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rightthreetimes; with a semi-colon" do
+    input = "&rightthreetimes;"
+    output = [["Character", "⋌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ring; with a semi-colon" do
+    input = "&ring;"
+    output = [["Character", "˚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: risingdotseq; with a semi-colon" do
+    input = "&risingdotseq;"
+    output = [["Character", "≓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rlarr; with a semi-colon" do
+    input = "&rlarr;"
+    output = [["Character", "⇄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rlhar; with a semi-colon" do
+    input = "&rlhar;"
+    output = [["Character", "⇌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rlm; with a semi-colon" do
+    input = "&rlm;"
+    output = [["Character", "‏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rmoust; with a semi-colon" do
+    input = "&rmoust;"
+    output = [["Character", "⎱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rmoustache; with a semi-colon" do
+    input = "&rmoustache;"
+    output = [["Character", "⎱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rnmid; with a semi-colon" do
+    input = "&rnmid;"
+    output = [["Character", "⫮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: roang; with a semi-colon" do
+    input = "&roang;"
+    output = [["Character", "⟭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: roarr; with a semi-colon" do
+    input = "&roarr;"
+    output = [["Character", "⇾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: robrk; with a semi-colon" do
+    input = "&robrk;"
+    output = [["Character", "⟧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ropar; with a semi-colon" do
+    input = "&ropar;"
+    output = [["Character", "⦆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ropf; with a semi-colon" do
+    input = "&ropf;"
+    output = [["Character", "𝕣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: roplus; with a semi-colon" do
+    input = "&roplus;"
+    output = [["Character", "⨮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rotimes; with a semi-colon" do
+    input = "&rotimes;"
+    output = [["Character", "⨵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rpar; with a semi-colon" do
+    input = "&rpar;"
+    output = [["Character", ")"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rpargt; with a semi-colon" do
+    input = "&rpargt;"
+    output = [["Character", "⦔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rppolint; with a semi-colon" do
+    input = "&rppolint;"
+    output = [["Character", "⨒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rrarr; with a semi-colon" do
+    input = "&rrarr;"
+    output = [["Character", "⇉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rsaquo; with a semi-colon" do
+    input = "&rsaquo;"
+    output = [["Character", "›"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rscr; with a semi-colon" do
+    input = "&rscr;"
+    output = [["Character", "𝓇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rsh; with a semi-colon" do
+    input = "&rsh;"
+    output = [["Character", "↱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rsqb; with a semi-colon" do
+    input = "&rsqb;"
+    output = [["Character", "]"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rsquo; with a semi-colon" do
+    input = "&rsquo;"
+    output = [["Character", "’"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rsquor; with a semi-colon" do
+    input = "&rsquor;"
+    output = [["Character", "’"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rthree; with a semi-colon" do
+    input = "&rthree;"
+    output = [["Character", "⋌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rtimes; with a semi-colon" do
+    input = "&rtimes;"
+    output = [["Character", "⋊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rtri; with a semi-colon" do
+    input = "&rtri;"
+    output = [["Character", "▹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rtrie; with a semi-colon" do
+    input = "&rtrie;"
+    output = [["Character", "⊵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rtrif; with a semi-colon" do
+    input = "&rtrif;"
+    output = [["Character", "▸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rtriltri; with a semi-colon" do
+    input = "&rtriltri;"
+    output = [["Character", "⧎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ruluhar; with a semi-colon" do
+    input = "&ruluhar;"
+    output = [["Character", "⥨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: rx; with a semi-colon" do
+    input = "&rx;"
+    output = [["Character", "℞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sacute; with a semi-colon" do
+    input = "&sacute;"
+    output = [["Character", "ś"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sbquo; with a semi-colon" do
+    input = "&sbquo;"
+    output = [["Character", "‚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sc; with a semi-colon" do
+    input = "&sc;"
+    output = [["Character", "≻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scE; with a semi-colon" do
+    input = "&scE;"
+    output = [["Character", "⪴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scap; with a semi-colon" do
+    input = "&scap;"
+    output = [["Character", "⪸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scaron; with a semi-colon" do
+    input = "&scaron;"
+    output = [["Character", "š"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sccue; with a semi-colon" do
+    input = "&sccue;"
+    output = [["Character", "≽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sce; with a semi-colon" do
+    input = "&sce;"
+    output = [["Character", "⪰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scedil; with a semi-colon" do
+    input = "&scedil;"
+    output = [["Character", "ş"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scirc; with a semi-colon" do
+    input = "&scirc;"
+    output = [["Character", "ŝ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scnE; with a semi-colon" do
+    input = "&scnE;"
+    output = [["Character", "⪶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scnap; with a semi-colon" do
+    input = "&scnap;"
+    output = [["Character", "⪺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scnsim; with a semi-colon" do
+    input = "&scnsim;"
+    output = [["Character", "⋩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scpolint; with a semi-colon" do
+    input = "&scpolint;"
+    output = [["Character", "⨓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scsim; with a semi-colon" do
+    input = "&scsim;"
+    output = [["Character", "≿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: scy; with a semi-colon" do
+    input = "&scy;"
+    output = [["Character", "с"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sdot; with a semi-colon" do
+    input = "&sdot;"
+    output = [["Character", "⋅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sdotb; with a semi-colon" do
+    input = "&sdotb;"
+    output = [["Character", "⊡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sdote; with a semi-colon" do
+    input = "&sdote;"
+    output = [["Character", "⩦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: seArr; with a semi-colon" do
+    input = "&seArr;"
+    output = [["Character", "⇘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: searhk; with a semi-colon" do
+    input = "&searhk;"
+    output = [["Character", "⤥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: searr; with a semi-colon" do
+    input = "&searr;"
+    output = [["Character", "↘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: searrow; with a semi-colon" do
+    input = "&searrow;"
+    output = [["Character", "↘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sect without a semi-colon" do
+    input = "&sect"
+    output = [["Character", "§"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sect; with a semi-colon" do
+    input = "&sect;"
+    output = [["Character", "§"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: semi; with a semi-colon" do
+    input = "&semi;"
+    output = [["Character", ";"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: seswar; with a semi-colon" do
+    input = "&seswar;"
+    output = [["Character", "⤩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: setminus; with a semi-colon" do
+    input = "&setminus;"
+    output = [["Character", "∖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: setmn; with a semi-colon" do
+    input = "&setmn;"
+    output = [["Character", "∖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sext; with a semi-colon" do
+    input = "&sext;"
+    output = [["Character", "✶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sfr; with a semi-colon" do
+    input = "&sfr;"
+    output = [["Character", "𝔰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sfrown; with a semi-colon" do
+    input = "&sfrown;"
+    output = [["Character", "⌢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sharp; with a semi-colon" do
+    input = "&sharp;"
+    output = [["Character", "♯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: shchcy; with a semi-colon" do
+    input = "&shchcy;"
+    output = [["Character", "щ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: shcy; with a semi-colon" do
+    input = "&shcy;"
+    output = [["Character", "ш"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: shortmid; with a semi-colon" do
+    input = "&shortmid;"
+    output = [["Character", "∣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: shortparallel; with a semi-colon" do
+    input = "&shortparallel;"
+    output = [["Character", "∥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: shy without a semi-colon" do
+    input = "&shy"
+    output = [["Character", "­"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: shy; with a semi-colon" do
+    input = "&shy;"
+    output = [["Character", "­"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sigma; with a semi-colon" do
+    input = "&sigma;"
+    output = [["Character", "σ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sigmaf; with a semi-colon" do
+    input = "&sigmaf;"
+    output = [["Character", "ς"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sigmav; with a semi-colon" do
+    input = "&sigmav;"
+    output = [["Character", "ς"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sim; with a semi-colon" do
+    input = "&sim;"
+    output = [["Character", "∼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simdot; with a semi-colon" do
+    input = "&simdot;"
+    output = [["Character", "⩪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sime; with a semi-colon" do
+    input = "&sime;"
+    output = [["Character", "≃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simeq; with a semi-colon" do
+    input = "&simeq;"
+    output = [["Character", "≃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simg; with a semi-colon" do
+    input = "&simg;"
+    output = [["Character", "⪞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simgE; with a semi-colon" do
+    input = "&simgE;"
+    output = [["Character", "⪠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: siml; with a semi-colon" do
+    input = "&siml;"
+    output = [["Character", "⪝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simlE; with a semi-colon" do
+    input = "&simlE;"
+    output = [["Character", "⪟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simne; with a semi-colon" do
+    input = "&simne;"
+    output = [["Character", "≆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simplus; with a semi-colon" do
+    input = "&simplus;"
+    output = [["Character", "⨤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: simrarr; with a semi-colon" do
+    input = "&simrarr;"
+    output = [["Character", "⥲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: slarr; with a semi-colon" do
+    input = "&slarr;"
+    output = [["Character", "←"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smallsetminus; with a semi-colon" do
+    input = "&smallsetminus;"
+    output = [["Character", "∖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smashp; with a semi-colon" do
+    input = "&smashp;"
+    output = [["Character", "⨳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smeparsl; with a semi-colon" do
+    input = "&smeparsl;"
+    output = [["Character", "⧤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smid; with a semi-colon" do
+    input = "&smid;"
+    output = [["Character", "∣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smile; with a semi-colon" do
+    input = "&smile;"
+    output = [["Character", "⌣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smt; with a semi-colon" do
+    input = "&smt;"
+    output = [["Character", "⪪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smte; with a semi-colon" do
+    input = "&smte;"
+    output = [["Character", "⪬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: smtes; with a semi-colon" do
+    input = "&smtes;"
+    output = [["Character", "⪬︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part3_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part3_test.exs
new file mode 100644
index 00000000..5cca7050
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part3_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart3Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: Kcedil without a semi-colon" do
+    input = "&Kcedil"
+    output = [["Character", "&Kcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Kcy without a semi-colon" do
+    input = "&Kcy"
+    output = [["Character", "&Kcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Kfr without a semi-colon" do
+    input = "&Kfr"
+    output = [["Character", "&Kfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Kopf without a semi-colon" do
+    input = "&Kopf"
+    output = [["Character", "&Kopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Kscr without a semi-colon" do
+    input = "&Kscr"
+    output = [["Character", "&Kscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LJcy without a semi-colon" do
+    input = "&LJcy"
+    output = [["Character", "&LJcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lacute without a semi-colon" do
+    input = "&Lacute"
+    output = [["Character", "&Lacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lambda without a semi-colon" do
+    input = "&Lambda"
+    output = [["Character", "&Lambda"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lang without a semi-colon" do
+    input = "&Lang"
+    output = [["Character", "&Lang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Laplacetrf without a semi-colon" do
+    input = "&Laplacetrf"
+    output = [["Character", "&Laplacetrf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Larr without a semi-colon" do
+    input = "&Larr"
+    output = [["Character", "&Larr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lcaron without a semi-colon" do
+    input = "&Lcaron"
+    output = [["Character", "&Lcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lcedil without a semi-colon" do
+    input = "&Lcedil"
+    output = [["Character", "&Lcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lcy without a semi-colon" do
+    input = "&Lcy"
+    output = [["Character", "&Lcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftAngleBracket without a semi-colon" do
+    input = "&LeftAngleBracket"
+    output = [["Character", "&LeftAngleBracket"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftArrow without a semi-colon" do
+    input = "&LeftArrow"
+    output = [["Character", "&LeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftArrowBar without a semi-colon" do
+    input = "&LeftArrowBar"
+    output = [["Character", "&LeftArrowBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftArrowRightArrow without a semi-colon" do
+    input = "&LeftArrowRightArrow"
+    output = [["Character", "&LeftArrowRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftCeiling without a semi-colon" do
+    input = "&LeftCeiling"
+    output = [["Character", "&LeftCeiling"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftDoubleBracket without a semi-colon" do
+    input = "&LeftDoubleBracket"
+    output = [["Character", "&LeftDoubleBracket"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftDownTeeVector without a semi-colon" do
+    input = "&LeftDownTeeVector"
+    output = [["Character", "&LeftDownTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftDownVector without a semi-colon" do
+    input = "&LeftDownVector"
+    output = [["Character", "&LeftDownVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftDownVectorBar without a semi-colon" do
+    input = "&LeftDownVectorBar"
+    output = [["Character", "&LeftDownVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftFloor without a semi-colon" do
+    input = "&LeftFloor"
+    output = [["Character", "&LeftFloor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftRightArrow without a semi-colon" do
+    input = "&LeftRightArrow"
+    output = [["Character", "&LeftRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftRightVector without a semi-colon" do
+    input = "&LeftRightVector"
+    output = [["Character", "&LeftRightVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftTee without a semi-colon" do
+    input = "&LeftTee"
+    output = [["Character", "&LeftTee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftTeeArrow without a semi-colon" do
+    input = "&LeftTeeArrow"
+    output = [["Character", "&LeftTeeArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftTeeVector without a semi-colon" do
+    input = "&LeftTeeVector"
+    output = [["Character", "&LeftTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftTriangle without a semi-colon" do
+    input = "&LeftTriangle"
+    output = [["Character", "&LeftTriangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftTriangleBar without a semi-colon" do
+    input = "&LeftTriangleBar"
+    output = [["Character", "&LeftTriangleBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftTriangleEqual without a semi-colon" do
+    input = "&LeftTriangleEqual"
+    output = [["Character", "&LeftTriangleEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftUpDownVector without a semi-colon" do
+    input = "&LeftUpDownVector"
+    output = [["Character", "&LeftUpDownVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftUpTeeVector without a semi-colon" do
+    input = "&LeftUpTeeVector"
+    output = [["Character", "&LeftUpTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftUpVector without a semi-colon" do
+    input = "&LeftUpVector"
+    output = [["Character", "&LeftUpVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftUpVectorBar without a semi-colon" do
+    input = "&LeftUpVectorBar"
+    output = [["Character", "&LeftUpVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftVector without a semi-colon" do
+    input = "&LeftVector"
+    output = [["Character", "&LeftVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LeftVectorBar without a semi-colon" do
+    input = "&LeftVectorBar"
+    output = [["Character", "&LeftVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Leftarrow without a semi-colon" do
+    input = "&Leftarrow"
+    output = [["Character", "&Leftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Leftrightarrow without a semi-colon" do
+    input = "&Leftrightarrow"
+    output = [["Character", "&Leftrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LessEqualGreater without a semi-colon" do
+    input = "&LessEqualGreater"
+    output = [["Character", "&LessEqualGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LessFullEqual without a semi-colon" do
+    input = "&LessFullEqual"
+    output = [["Character", "&LessFullEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LessGreater without a semi-colon" do
+    input = "&LessGreater"
+    output = [["Character", "&LessGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LessLess without a semi-colon" do
+    input = "&LessLess"
+    output = [["Character", "&LessLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LessSlantEqual without a semi-colon" do
+    input = "&LessSlantEqual"
+    output = [["Character", "&LessSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LessTilde without a semi-colon" do
+    input = "&LessTilde"
+    output = [["Character", "&LessTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lfr without a semi-colon" do
+    input = "&Lfr"
+    output = [["Character", "&Lfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ll without a semi-colon" do
+    input = "&Ll"
+    output = [["Character", "&Ll"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lleftarrow without a semi-colon" do
+    input = "&Lleftarrow"
+    output = [["Character", "&Lleftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lmidot without a semi-colon" do
+    input = "&Lmidot"
+    output = [["Character", "&Lmidot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LongLeftArrow without a semi-colon" do
+    input = "&LongLeftArrow"
+    output = [["Character", "&LongLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LongLeftRightArrow without a semi-colon" do
+    input = "&LongLeftRightArrow"
+    output = [["Character", "&LongLeftRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LongRightArrow without a semi-colon" do
+    input = "&LongRightArrow"
+    output = [["Character", "&LongRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Longleftarrow without a semi-colon" do
+    input = "&Longleftarrow"
+    output = [["Character", "&Longleftarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Longleftrightarrow without a semi-colon" do
+    input = "&Longleftrightarrow"
+    output = [["Character", "&Longleftrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Longrightarrow without a semi-colon" do
+    input = "&Longrightarrow"
+    output = [["Character", "&Longrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lopf without a semi-colon" do
+    input = "&Lopf"
+    output = [["Character", "&Lopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LowerLeftArrow without a semi-colon" do
+    input = "&LowerLeftArrow"
+    output = [["Character", "&LowerLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: LowerRightArrow without a semi-colon" do
+    input = "&LowerRightArrow"
+    output = [["Character", "&LowerRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lscr without a semi-colon" do
+    input = "&Lscr"
+    output = [["Character", "&Lscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lsh without a semi-colon" do
+    input = "&Lsh"
+    output = [["Character", "&Lsh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lstrok without a semi-colon" do
+    input = "&Lstrok"
+    output = [["Character", "&Lstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Lt without a semi-colon" do
+    input = "&Lt"
+    output = [["Character", "&Lt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Map without a semi-colon" do
+    input = "&Map"
+    output = [["Character", "&Map"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Mcy without a semi-colon" do
+    input = "&Mcy"
+    output = [["Character", "&Mcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: MediumSpace without a semi-colon" do
+    input = "&MediumSpace"
+    output = [["Character", "&MediumSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Mellintrf without a semi-colon" do
+    input = "&Mellintrf"
+    output = [["Character", "&Mellintrf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Mfr without a semi-colon" do
+    input = "&Mfr"
+    output = [["Character", "&Mfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: MinusPlus without a semi-colon" do
+    input = "&MinusPlus"
+    output = [["Character", "&MinusPlus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Mopf without a semi-colon" do
+    input = "&Mopf"
+    output = [["Character", "&Mopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Mscr without a semi-colon" do
+    input = "&Mscr"
+    output = [["Character", "&Mscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Mu without a semi-colon" do
+    input = "&Mu"
+    output = [["Character", "&Mu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NJcy without a semi-colon" do
+    input = "&NJcy"
+    output = [["Character", "&NJcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Nacute without a semi-colon" do
+    input = "&Nacute"
+    output = [["Character", "&Nacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ncaron without a semi-colon" do
+    input = "&Ncaron"
+    output = [["Character", "&Ncaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ncedil without a semi-colon" do
+    input = "&Ncedil"
+    output = [["Character", "&Ncedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ncy without a semi-colon" do
+    input = "&Ncy"
+    output = [["Character", "&Ncy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NegativeMediumSpace without a semi-colon" do
+    input = "&NegativeMediumSpace"
+    output = [["Character", "&NegativeMediumSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NegativeThickSpace without a semi-colon" do
+    input = "&NegativeThickSpace"
+    output = [["Character", "&NegativeThickSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NegativeThinSpace without a semi-colon" do
+    input = "&NegativeThinSpace"
+    output = [["Character", "&NegativeThinSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NegativeVeryThinSpace without a semi-colon" do
+    input = "&NegativeVeryThinSpace"
+    output = [["Character", "&NegativeVeryThinSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NestedGreaterGreater without a semi-colon" do
+    input = "&NestedGreaterGreater"
+    output = [["Character", "&NestedGreaterGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NestedLessLess without a semi-colon" do
+    input = "&NestedLessLess"
+    output = [["Character", "&NestedLessLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NewLine without a semi-colon" do
+    input = "&NewLine"
+    output = [["Character", "&NewLine"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Nfr without a semi-colon" do
+    input = "&Nfr"
+    output = [["Character", "&Nfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NoBreak without a semi-colon" do
+    input = "&NoBreak"
+    output = [["Character", "&NoBreak"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NonBreakingSpace without a semi-colon" do
+    input = "&NonBreakingSpace"
+    output = [["Character", "&NonBreakingSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Nopf without a semi-colon" do
+    input = "&Nopf"
+    output = [["Character", "&Nopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Not without a semi-colon" do
+    input = "&Not"
+    output = [["Character", "&Not"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotCongruent without a semi-colon" do
+    input = "&NotCongruent"
+    output = [["Character", "&NotCongruent"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotCupCap without a semi-colon" do
+    input = "&NotCupCap"
+    output = [["Character", "&NotCupCap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotDoubleVerticalBar without a semi-colon" do
+    input = "&NotDoubleVerticalBar"
+    output = [["Character", "&NotDoubleVerticalBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotElement without a semi-colon" do
+    input = "&NotElement"
+    output = [["Character", "&NotElement"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotEqual without a semi-colon" do
+    input = "&NotEqual"
+    output = [["Character", "&NotEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotEqualTilde without a semi-colon" do
+    input = "&NotEqualTilde"
+    output = [["Character", "&NotEqualTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotExists without a semi-colon" do
+    input = "&NotExists"
+    output = [["Character", "&NotExists"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotGreater without a semi-colon" do
+    input = "&NotGreater"
+    output = [["Character", "&NotGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotGreaterEqual without a semi-colon" do
+    input = "&NotGreaterEqual"
+    output = [["Character", "&NotGreaterEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotGreaterFullEqual without a semi-colon" do
+    input = "&NotGreaterFullEqual"
+    output = [["Character", "&NotGreaterFullEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotGreaterGreater without a semi-colon" do
+    input = "&NotGreaterGreater"
+    output = [["Character", "&NotGreaterGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part40_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part40_test.exs
new file mode 100644
index 00000000..2f5c4893
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part40_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart40Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: softcy; with a semi-colon" do
+    input = "&softcy;"
+    output = [["Character", "ь"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sol; with a semi-colon" do
+    input = "&sol;"
+    output = [["Character", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: solb; with a semi-colon" do
+    input = "&solb;"
+    output = [["Character", "⧄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: solbar; with a semi-colon" do
+    input = "&solbar;"
+    output = [["Character", "⌿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sopf; with a semi-colon" do
+    input = "&sopf;"
+    output = [["Character", "𝕤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: spades; with a semi-colon" do
+    input = "&spades;"
+    output = [["Character", "♠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: spadesuit; with a semi-colon" do
+    input = "&spadesuit;"
+    output = [["Character", "♠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: spar; with a semi-colon" do
+    input = "&spar;"
+    output = [["Character", "∥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqcap; with a semi-colon" do
+    input = "&sqcap;"
+    output = [["Character", "⊓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqcaps; with a semi-colon" do
+    input = "&sqcaps;"
+    output = [["Character", "⊓︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqcup; with a semi-colon" do
+    input = "&sqcup;"
+    output = [["Character", "⊔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqcups; with a semi-colon" do
+    input = "&sqcups;"
+    output = [["Character", "⊔︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsub; with a semi-colon" do
+    input = "&sqsub;"
+    output = [["Character", "⊏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsube; with a semi-colon" do
+    input = "&sqsube;"
+    output = [["Character", "⊑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsubset; with a semi-colon" do
+    input = "&sqsubset;"
+    output = [["Character", "⊏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsubseteq; with a semi-colon" do
+    input = "&sqsubseteq;"
+    output = [["Character", "⊑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsup; with a semi-colon" do
+    input = "&sqsup;"
+    output = [["Character", "⊐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsupe; with a semi-colon" do
+    input = "&sqsupe;"
+    output = [["Character", "⊒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsupset; with a semi-colon" do
+    input = "&sqsupset;"
+    output = [["Character", "⊐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sqsupseteq; with a semi-colon" do
+    input = "&sqsupseteq;"
+    output = [["Character", "⊒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: squ; with a semi-colon" do
+    input = "&squ;"
+    output = [["Character", "□"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: square; with a semi-colon" do
+    input = "&square;"
+    output = [["Character", "□"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: squarf; with a semi-colon" do
+    input = "&squarf;"
+    output = [["Character", "▪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: squf; with a semi-colon" do
+    input = "&squf;"
+    output = [["Character", "▪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: srarr; with a semi-colon" do
+    input = "&srarr;"
+    output = [["Character", "→"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sscr; with a semi-colon" do
+    input = "&sscr;"
+    output = [["Character", "𝓈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ssetmn; with a semi-colon" do
+    input = "&ssetmn;"
+    output = [["Character", "∖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ssmile; with a semi-colon" do
+    input = "&ssmile;"
+    output = [["Character", "⌣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sstarf; with a semi-colon" do
+    input = "&sstarf;"
+    output = [["Character", "⋆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: star; with a semi-colon" do
+    input = "&star;"
+    output = [["Character", "☆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: starf; with a semi-colon" do
+    input = "&starf;"
+    output = [["Character", "★"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: straightepsilon; with a semi-colon" do
+    input = "&straightepsilon;"
+    output = [["Character", "ϵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: straightphi; with a semi-colon" do
+    input = "&straightphi;"
+    output = [["Character", "ϕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: strns; with a semi-colon" do
+    input = "&strns;"
+    output = [["Character", "¯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sub; with a semi-colon" do
+    input = "&sub;"
+    output = [["Character", "⊂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subE; with a semi-colon" do
+    input = "&subE;"
+    output = [["Character", "⫅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subdot; with a semi-colon" do
+    input = "&subdot;"
+    output = [["Character", "⪽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sube; with a semi-colon" do
+    input = "&sube;"
+    output = [["Character", "⊆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subedot; with a semi-colon" do
+    input = "&subedot;"
+    output = [["Character", "⫃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: submult; with a semi-colon" do
+    input = "&submult;"
+    output = [["Character", "⫁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subnE; with a semi-colon" do
+    input = "&subnE;"
+    output = [["Character", "⫋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subne; with a semi-colon" do
+    input = "&subne;"
+    output = [["Character", "⊊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subplus; with a semi-colon" do
+    input = "&subplus;"
+    output = [["Character", "⪿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subrarr; with a semi-colon" do
+    input = "&subrarr;"
+    output = [["Character", "⥹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subset; with a semi-colon" do
+    input = "&subset;"
+    output = [["Character", "⊂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subseteq; with a semi-colon" do
+    input = "&subseteq;"
+    output = [["Character", "⊆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subseteqq; with a semi-colon" do
+    input = "&subseteqq;"
+    output = [["Character", "⫅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subsetneq; with a semi-colon" do
+    input = "&subsetneq;"
+    output = [["Character", "⊊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subsetneqq; with a semi-colon" do
+    input = "&subsetneqq;"
+    output = [["Character", "⫋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subsim; with a semi-colon" do
+    input = "&subsim;"
+    output = [["Character", "⫇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subsub; with a semi-colon" do
+    input = "&subsub;"
+    output = [["Character", "⫕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: subsup; with a semi-colon" do
+    input = "&subsup;"
+    output = [["Character", "⫓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succ; with a semi-colon" do
+    input = "&succ;"
+    output = [["Character", "≻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succapprox; with a semi-colon" do
+    input = "&succapprox;"
+    output = [["Character", "⪸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succcurlyeq; with a semi-colon" do
+    input = "&succcurlyeq;"
+    output = [["Character", "≽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succeq; with a semi-colon" do
+    input = "&succeq;"
+    output = [["Character", "⪰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succnapprox; with a semi-colon" do
+    input = "&succnapprox;"
+    output = [["Character", "⪺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succneqq; with a semi-colon" do
+    input = "&succneqq;"
+    output = [["Character", "⪶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succnsim; with a semi-colon" do
+    input = "&succnsim;"
+    output = [["Character", "⋩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: succsim; with a semi-colon" do
+    input = "&succsim;"
+    output = [["Character", "≿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sum; with a semi-colon" do
+    input = "&sum;"
+    output = [["Character", "∑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sung; with a semi-colon" do
+    input = "&sung;"
+    output = [["Character", "♪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup1 without a semi-colon" do
+    input = "&sup1"
+    output = [["Character", "¹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup1; with a semi-colon" do
+    input = "&sup1;"
+    output = [["Character", "¹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup2 without a semi-colon" do
+    input = "&sup2"
+    output = [["Character", "²"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup2; with a semi-colon" do
+    input = "&sup2;"
+    output = [["Character", "²"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup3 without a semi-colon" do
+    input = "&sup3"
+    output = [["Character", "³"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup3; with a semi-colon" do
+    input = "&sup3;"
+    output = [["Character", "³"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: sup; with a semi-colon" do
+    input = "&sup;"
+    output = [["Character", "⊃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supE; with a semi-colon" do
+    input = "&supE;"
+    output = [["Character", "⫆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supdot; with a semi-colon" do
+    input = "&supdot;"
+    output = [["Character", "⪾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supdsub; with a semi-colon" do
+    input = "&supdsub;"
+    output = [["Character", "⫘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supe; with a semi-colon" do
+    input = "&supe;"
+    output = [["Character", "⊇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supedot; with a semi-colon" do
+    input = "&supedot;"
+    output = [["Character", "⫄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: suphsol; with a semi-colon" do
+    input = "&suphsol;"
+    output = [["Character", "⟉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: suphsub; with a semi-colon" do
+    input = "&suphsub;"
+    output = [["Character", "⫗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: suplarr; with a semi-colon" do
+    input = "&suplarr;"
+    output = [["Character", "⥻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supmult; with a semi-colon" do
+    input = "&supmult;"
+    output = [["Character", "⫂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supnE; with a semi-colon" do
+    input = "&supnE;"
+    output = [["Character", "⫌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supne; with a semi-colon" do
+    input = "&supne;"
+    output = [["Character", "⊋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supplus; with a semi-colon" do
+    input = "&supplus;"
+    output = [["Character", "⫀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supset; with a semi-colon" do
+    input = "&supset;"
+    output = [["Character", "⊃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supseteq; with a semi-colon" do
+    input = "&supseteq;"
+    output = [["Character", "⊇"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supseteqq; with a semi-colon" do
+    input = "&supseteqq;"
+    output = [["Character", "⫆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supsetneq; with a semi-colon" do
+    input = "&supsetneq;"
+    output = [["Character", "⊋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supsetneqq; with a semi-colon" do
+    input = "&supsetneqq;"
+    output = [["Character", "⫌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supsim; with a semi-colon" do
+    input = "&supsim;"
+    output = [["Character", "⫈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supsub; with a semi-colon" do
+    input = "&supsub;"
+    output = [["Character", "⫔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: supsup; with a semi-colon" do
+    input = "&supsup;"
+    output = [["Character", "⫖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: swArr; with a semi-colon" do
+    input = "&swArr;"
+    output = [["Character", "⇙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: swarhk; with a semi-colon" do
+    input = "&swarhk;"
+    output = [["Character", "⤦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: swarr; with a semi-colon" do
+    input = "&swarr;"
+    output = [["Character", "↙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: swarrow; with a semi-colon" do
+    input = "&swarrow;"
+    output = [["Character", "↙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: swnwar; with a semi-colon" do
+    input = "&swnwar;"
+    output = [["Character", "⤪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: szlig without a semi-colon" do
+    input = "&szlig"
+    output = [["Character", "ß"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: szlig; with a semi-colon" do
+    input = "&szlig;"
+    output = [["Character", "ß"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: target; with a semi-colon" do
+    input = "&target;"
+    output = [["Character", "⌖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tau; with a semi-colon" do
+    input = "&tau;"
+    output = [["Character", "τ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tbrk; with a semi-colon" do
+    input = "&tbrk;"
+    output = [["Character", "⎴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tcaron; with a semi-colon" do
+    input = "&tcaron;"
+    output = [["Character", "ť"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part41_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part41_test.exs
new file mode 100644
index 00000000..7b088e79
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part41_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart41Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: tcedil; with a semi-colon" do
+    input = "&tcedil;"
+    output = [["Character", "ţ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tcy; with a semi-colon" do
+    input = "&tcy;"
+    output = [["Character", "т"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tdot; with a semi-colon" do
+    input = "&tdot;"
+    output = [["Character", "⃛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: telrec; with a semi-colon" do
+    input = "&telrec;"
+    output = [["Character", "⌕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tfr; with a semi-colon" do
+    input = "&tfr;"
+    output = [["Character", "𝔱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: there4; with a semi-colon" do
+    input = "&there4;"
+    output = [["Character", "∴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: therefore; with a semi-colon" do
+    input = "&therefore;"
+    output = [["Character", "∴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: theta; with a semi-colon" do
+    input = "&theta;"
+    output = [["Character", "θ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thetasym; with a semi-colon" do
+    input = "&thetasym;"
+    output = [["Character", "ϑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thetav; with a semi-colon" do
+    input = "&thetav;"
+    output = [["Character", "ϑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thickapprox; with a semi-colon" do
+    input = "&thickapprox;"
+    output = [["Character", "≈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thicksim; with a semi-colon" do
+    input = "&thicksim;"
+    output = [["Character", "∼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thinsp; with a semi-colon" do
+    input = "&thinsp;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thkap; with a semi-colon" do
+    input = "&thkap;"
+    output = [["Character", "≈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thksim; with a semi-colon" do
+    input = "&thksim;"
+    output = [["Character", "∼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thorn without a semi-colon" do
+    input = "&thorn"
+    output = [["Character", "þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: thorn; with a semi-colon" do
+    input = "&thorn;"
+    output = [["Character", "þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tilde; with a semi-colon" do
+    input = "&tilde;"
+    output = [["Character", "˜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: times without a semi-colon" do
+    input = "&times"
+    output = [["Character", "×"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: times; with a semi-colon" do
+    input = "&times;"
+    output = [["Character", "×"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: timesb; with a semi-colon" do
+    input = "&timesb;"
+    output = [["Character", "⊠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: timesbar; with a semi-colon" do
+    input = "&timesbar;"
+    output = [["Character", "⨱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: timesd; with a semi-colon" do
+    input = "&timesd;"
+    output = [["Character", "⨰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tint; with a semi-colon" do
+    input = "&tint;"
+    output = [["Character", "∭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: toea; with a semi-colon" do
+    input = "&toea;"
+    output = [["Character", "⤨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: top; with a semi-colon" do
+    input = "&top;"
+    output = [["Character", "⊤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: topbot; with a semi-colon" do
+    input = "&topbot;"
+    output = [["Character", "⌶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: topcir; with a semi-colon" do
+    input = "&topcir;"
+    output = [["Character", "⫱"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: topf; with a semi-colon" do
+    input = "&topf;"
+    output = [["Character", "𝕥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: topfork; with a semi-colon" do
+    input = "&topfork;"
+    output = [["Character", "⫚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tosa; with a semi-colon" do
+    input = "&tosa;"
+    output = [["Character", "⤩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tprime; with a semi-colon" do
+    input = "&tprime;"
+    output = [["Character", "‴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: trade; with a semi-colon" do
+    input = "&trade;"
+    output = [["Character", "™"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triangle; with a semi-colon" do
+    input = "&triangle;"
+    output = [["Character", "▵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triangledown; with a semi-colon" do
+    input = "&triangledown;"
+    output = [["Character", "▿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triangleleft; with a semi-colon" do
+    input = "&triangleleft;"
+    output = [["Character", "◃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: trianglelefteq; with a semi-colon" do
+    input = "&trianglelefteq;"
+    output = [["Character", "⊴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triangleq; with a semi-colon" do
+    input = "&triangleq;"
+    output = [["Character", "≜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triangleright; with a semi-colon" do
+    input = "&triangleright;"
+    output = [["Character", "▹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: trianglerighteq; with a semi-colon" do
+    input = "&trianglerighteq;"
+    output = [["Character", "⊵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tridot; with a semi-colon" do
+    input = "&tridot;"
+    output = [["Character", "◬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: trie; with a semi-colon" do
+    input = "&trie;"
+    output = [["Character", "≜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triminus; with a semi-colon" do
+    input = "&triminus;"
+    output = [["Character", "⨺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: triplus; with a semi-colon" do
+    input = "&triplus;"
+    output = [["Character", "⨹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: trisb; with a semi-colon" do
+    input = "&trisb;"
+    output = [["Character", "⧍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tritime; with a semi-colon" do
+    input = "&tritime;"
+    output = [["Character", "⨻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: trpezium; with a semi-colon" do
+    input = "&trpezium;"
+    output = [["Character", "⏢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tscr; with a semi-colon" do
+    input = "&tscr;"
+    output = [["Character", "𝓉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tscy; with a semi-colon" do
+    input = "&tscy;"
+    output = [["Character", "ц"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tshcy; with a semi-colon" do
+    input = "&tshcy;"
+    output = [["Character", "ћ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: tstrok; with a semi-colon" do
+    input = "&tstrok;"
+    output = [["Character", "ŧ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: twixt; with a semi-colon" do
+    input = "&twixt;"
+    output = [["Character", "≬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: twoheadleftarrow; with a semi-colon" do
+    input = "&twoheadleftarrow;"
+    output = [["Character", "↞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: twoheadrightarrow; with a semi-colon" do
+    input = "&twoheadrightarrow;"
+    output = [["Character", "↠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uArr; with a semi-colon" do
+    input = "&uArr;"
+    output = [["Character", "⇑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uHar; with a semi-colon" do
+    input = "&uHar;"
+    output = [["Character", "⥣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uacute without a semi-colon" do
+    input = "&uacute"
+    output = [["Character", "ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uacute; with a semi-colon" do
+    input = "&uacute;"
+    output = [["Character", "ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uarr; with a semi-colon" do
+    input = "&uarr;"
+    output = [["Character", "↑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ubrcy; with a semi-colon" do
+    input = "&ubrcy;"
+    output = [["Character", "ў"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ubreve; with a semi-colon" do
+    input = "&ubreve;"
+    output = [["Character", "ŭ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ucirc without a semi-colon" do
+    input = "&ucirc"
+    output = [["Character", "û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ucirc; with a semi-colon" do
+    input = "&ucirc;"
+    output = [["Character", "û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ucy; with a semi-colon" do
+    input = "&ucy;"
+    output = [["Character", "у"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: udarr; with a semi-colon" do
+    input = "&udarr;"
+    output = [["Character", "⇅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: udblac; with a semi-colon" do
+    input = "&udblac;"
+    output = [["Character", "ű"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: udhar; with a semi-colon" do
+    input = "&udhar;"
+    output = [["Character", "⥮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ufisht; with a semi-colon" do
+    input = "&ufisht;"
+    output = [["Character", "⥾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ufr; with a semi-colon" do
+    input = "&ufr;"
+    output = [["Character", "𝔲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ugrave without a semi-colon" do
+    input = "&ugrave"
+    output = [["Character", "ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ugrave; with a semi-colon" do
+    input = "&ugrave;"
+    output = [["Character", "ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uharl; with a semi-colon" do
+    input = "&uharl;"
+    output = [["Character", "↿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uharr; with a semi-colon" do
+    input = "&uharr;"
+    output = [["Character", "↾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uhblk; with a semi-colon" do
+    input = "&uhblk;"
+    output = [["Character", "▀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ulcorn; with a semi-colon" do
+    input = "&ulcorn;"
+    output = [["Character", "⌜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ulcorner; with a semi-colon" do
+    input = "&ulcorner;"
+    output = [["Character", "⌜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ulcrop; with a semi-colon" do
+    input = "&ulcrop;"
+    output = [["Character", "⌏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ultri; with a semi-colon" do
+    input = "&ultri;"
+    output = [["Character", "◸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: umacr; with a semi-colon" do
+    input = "&umacr;"
+    output = [["Character", "ū"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uml without a semi-colon" do
+    input = "&uml"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uml; with a semi-colon" do
+    input = "&uml;"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uogon; with a semi-colon" do
+    input = "&uogon;"
+    output = [["Character", "ų"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uopf; with a semi-colon" do
+    input = "&uopf;"
+    output = [["Character", "𝕦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uparrow; with a semi-colon" do
+    input = "&uparrow;"
+    output = [["Character", "↑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: updownarrow; with a semi-colon" do
+    input = "&updownarrow;"
+    output = [["Character", "↕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: upharpoonleft; with a semi-colon" do
+    input = "&upharpoonleft;"
+    output = [["Character", "↿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: upharpoonright; with a semi-colon" do
+    input = "&upharpoonright;"
+    output = [["Character", "↾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uplus; with a semi-colon" do
+    input = "&uplus;"
+    output = [["Character", "⊎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: upsi; with a semi-colon" do
+    input = "&upsi;"
+    output = [["Character", "υ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: upsih; with a semi-colon" do
+    input = "&upsih;"
+    output = [["Character", "ϒ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: upsilon; with a semi-colon" do
+    input = "&upsilon;"
+    output = [["Character", "υ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: upuparrows; with a semi-colon" do
+    input = "&upuparrows;"
+    output = [["Character", "⇈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: urcorn; with a semi-colon" do
+    input = "&urcorn;"
+    output = [["Character", "⌝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: urcorner; with a semi-colon" do
+    input = "&urcorner;"
+    output = [["Character", "⌝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: urcrop; with a semi-colon" do
+    input = "&urcrop;"
+    output = [["Character", "⌎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uring; with a semi-colon" do
+    input = "&uring;"
+    output = [["Character", "ů"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: urtri; with a semi-colon" do
+    input = "&urtri;"
+    output = [["Character", "◹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uscr; with a semi-colon" do
+    input = "&uscr;"
+    output = [["Character", "𝓊"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: utdot; with a semi-colon" do
+    input = "&utdot;"
+    output = [["Character", "⋰"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: utilde; with a semi-colon" do
+    input = "&utilde;"
+    output = [["Character", "ũ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part42_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part42_test.exs
new file mode 100644
index 00000000..8f8e6643
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part42_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart42Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: utri; with a semi-colon" do
+    input = "&utri;"
+    output = [["Character", "▵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: utrif; with a semi-colon" do
+    input = "&utrif;"
+    output = [["Character", "▴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uuarr; with a semi-colon" do
+    input = "&uuarr;"
+    output = [["Character", "⇈"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uuml without a semi-colon" do
+    input = "&uuml"
+    output = [["Character", "ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uuml; with a semi-colon" do
+    input = "&uuml;"
+    output = [["Character", "ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: uwangle; with a semi-colon" do
+    input = "&uwangle;"
+    output = [["Character", "⦧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vArr; with a semi-colon" do
+    input = "&vArr;"
+    output = [["Character", "⇕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vBar; with a semi-colon" do
+    input = "&vBar;"
+    output = [["Character", "⫨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vBarv; with a semi-colon" do
+    input = "&vBarv;"
+    output = [["Character", "⫩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vDash; with a semi-colon" do
+    input = "&vDash;"
+    output = [["Character", "⊨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vangrt; with a semi-colon" do
+    input = "&vangrt;"
+    output = [["Character", "⦜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varepsilon; with a semi-colon" do
+    input = "&varepsilon;"
+    output = [["Character", "ϵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varkappa; with a semi-colon" do
+    input = "&varkappa;"
+    output = [["Character", "ϰ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varnothing; with a semi-colon" do
+    input = "&varnothing;"
+    output = [["Character", "∅"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varphi; with a semi-colon" do
+    input = "&varphi;"
+    output = [["Character", "ϕ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varpi; with a semi-colon" do
+    input = "&varpi;"
+    output = [["Character", "ϖ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varpropto; with a semi-colon" do
+    input = "&varpropto;"
+    output = [["Character", "∝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varr; with a semi-colon" do
+    input = "&varr;"
+    output = [["Character", "↕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varrho; with a semi-colon" do
+    input = "&varrho;"
+    output = [["Character", "ϱ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varsigma; with a semi-colon" do
+    input = "&varsigma;"
+    output = [["Character", "ς"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varsubsetneq; with a semi-colon" do
+    input = "&varsubsetneq;"
+    output = [["Character", "⊊︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varsubsetneqq; with a semi-colon" do
+    input = "&varsubsetneqq;"
+    output = [["Character", "⫋︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varsupsetneq; with a semi-colon" do
+    input = "&varsupsetneq;"
+    output = [["Character", "⊋︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: varsupsetneqq; with a semi-colon" do
+    input = "&varsupsetneqq;"
+    output = [["Character", "⫌︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vartheta; with a semi-colon" do
+    input = "&vartheta;"
+    output = [["Character", "ϑ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vartriangleleft; with a semi-colon" do
+    input = "&vartriangleleft;"
+    output = [["Character", "⊲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vartriangleright; with a semi-colon" do
+    input = "&vartriangleright;"
+    output = [["Character", "⊳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vcy; with a semi-colon" do
+    input = "&vcy;"
+    output = [["Character", "в"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vdash; with a semi-colon" do
+    input = "&vdash;"
+    output = [["Character", "⊢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vee; with a semi-colon" do
+    input = "&vee;"
+    output = [["Character", "∨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: veebar; with a semi-colon" do
+    input = "&veebar;"
+    output = [["Character", "⊻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: veeeq; with a semi-colon" do
+    input = "&veeeq;"
+    output = [["Character", "≚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vellip; with a semi-colon" do
+    input = "&vellip;"
+    output = [["Character", "⋮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: verbar; with a semi-colon" do
+    input = "&verbar;"
+    output = [["Character", "|"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vert; with a semi-colon" do
+    input = "&vert;"
+    output = [["Character", "|"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vfr; with a semi-colon" do
+    input = "&vfr;"
+    output = [["Character", "𝔳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vltri; with a semi-colon" do
+    input = "&vltri;"
+    output = [["Character", "⊲"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vnsub; with a semi-colon" do
+    input = "&vnsub;"
+    output = [["Character", "⊂⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vnsup; with a semi-colon" do
+    input = "&vnsup;"
+    output = [["Character", "⊃⃒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vopf; with a semi-colon" do
+    input = "&vopf;"
+    output = [["Character", "𝕧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vprop; with a semi-colon" do
+    input = "&vprop;"
+    output = [["Character", "∝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vrtri; with a semi-colon" do
+    input = "&vrtri;"
+    output = [["Character", "⊳"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vscr; with a semi-colon" do
+    input = "&vscr;"
+    output = [["Character", "𝓋"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vsubnE; with a semi-colon" do
+    input = "&vsubnE;"
+    output = [["Character", "⫋︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vsubne; with a semi-colon" do
+    input = "&vsubne;"
+    output = [["Character", "⊊︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vsupnE; with a semi-colon" do
+    input = "&vsupnE;"
+    output = [["Character", "⫌︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vsupne; with a semi-colon" do
+    input = "&vsupne;"
+    output = [["Character", "⊋︀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: vzigzag; with a semi-colon" do
+    input = "&vzigzag;"
+    output = [["Character", "⦚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wcirc; with a semi-colon" do
+    input = "&wcirc;"
+    output = [["Character", "ŵ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wedbar; with a semi-colon" do
+    input = "&wedbar;"
+    output = [["Character", "⩟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wedge; with a semi-colon" do
+    input = "&wedge;"
+    output = [["Character", "∧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wedgeq; with a semi-colon" do
+    input = "&wedgeq;"
+    output = [["Character", "≙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: weierp; with a semi-colon" do
+    input = "&weierp;"
+    output = [["Character", "℘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wfr; with a semi-colon" do
+    input = "&wfr;"
+    output = [["Character", "𝔴"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wopf; with a semi-colon" do
+    input = "&wopf;"
+    output = [["Character", "𝕨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wp; with a semi-colon" do
+    input = "&wp;"
+    output = [["Character", "℘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wr; with a semi-colon" do
+    input = "&wr;"
+    output = [["Character", "≀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wreath; with a semi-colon" do
+    input = "&wreath;"
+    output = [["Character", "≀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: wscr; with a semi-colon" do
+    input = "&wscr;"
+    output = [["Character", "𝓌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xcap; with a semi-colon" do
+    input = "&xcap;"
+    output = [["Character", "⋂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xcirc; with a semi-colon" do
+    input = "&xcirc;"
+    output = [["Character", "◯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xcup; with a semi-colon" do
+    input = "&xcup;"
+    output = [["Character", "⋃"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xdtri; with a semi-colon" do
+    input = "&xdtri;"
+    output = [["Character", "▽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xfr; with a semi-colon" do
+    input = "&xfr;"
+    output = [["Character", "𝔵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xhArr; with a semi-colon" do
+    input = "&xhArr;"
+    output = [["Character", "⟺"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xharr; with a semi-colon" do
+    input = "&xharr;"
+    output = [["Character", "⟷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xi; with a semi-colon" do
+    input = "&xi;"
+    output = [["Character", "ξ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xlArr; with a semi-colon" do
+    input = "&xlArr;"
+    output = [["Character", "⟸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xlarr; with a semi-colon" do
+    input = "&xlarr;"
+    output = [["Character", "⟵"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xmap; with a semi-colon" do
+    input = "&xmap;"
+    output = [["Character", "⟼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xnis; with a semi-colon" do
+    input = "&xnis;"
+    output = [["Character", "⋻"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xodot; with a semi-colon" do
+    input = "&xodot;"
+    output = [["Character", "⨀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xopf; with a semi-colon" do
+    input = "&xopf;"
+    output = [["Character", "𝕩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xoplus; with a semi-colon" do
+    input = "&xoplus;"
+    output = [["Character", "⨁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xotime; with a semi-colon" do
+    input = "&xotime;"
+    output = [["Character", "⨂"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xrArr; with a semi-colon" do
+    input = "&xrArr;"
+    output = [["Character", "⟹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xrarr; with a semi-colon" do
+    input = "&xrarr;"
+    output = [["Character", "⟶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xscr; with a semi-colon" do
+    input = "&xscr;"
+    output = [["Character", "𝓍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xsqcup; with a semi-colon" do
+    input = "&xsqcup;"
+    output = [["Character", "⨆"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xuplus; with a semi-colon" do
+    input = "&xuplus;"
+    output = [["Character", "⨄"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xutri; with a semi-colon" do
+    input = "&xutri;"
+    output = [["Character", "△"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xvee; with a semi-colon" do
+    input = "&xvee;"
+    output = [["Character", "⋁"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: xwedge; with a semi-colon" do
+    input = "&xwedge;"
+    output = [["Character", "⋀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yacute without a semi-colon" do
+    input = "&yacute"
+    output = [["Character", "ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yacute; with a semi-colon" do
+    input = "&yacute;"
+    output = [["Character", "ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yacy; with a semi-colon" do
+    input = "&yacy;"
+    output = [["Character", "я"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ycirc; with a semi-colon" do
+    input = "&ycirc;"
+    output = [["Character", "ŷ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: ycy; with a semi-colon" do
+    input = "&ycy;"
+    output = [["Character", "ы"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yen without a semi-colon" do
+    input = "&yen"
+    output = [["Character", "¥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yen; with a semi-colon" do
+    input = "&yen;"
+    output = [["Character", "¥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yfr; with a semi-colon" do
+    input = "&yfr;"
+    output = [["Character", "𝔶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yicy; with a semi-colon" do
+    input = "&yicy;"
+    output = [["Character", "ї"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yopf; with a semi-colon" do
+    input = "&yopf;"
+    output = [["Character", "𝕪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yscr; with a semi-colon" do
+    input = "&yscr;"
+    output = [["Character", "𝓎"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yucy; with a semi-colon" do
+    input = "&yucy;"
+    output = [["Character", "ю"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yuml without a semi-colon" do
+    input = "&yuml"
+    output = [["Character", "ÿ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: yuml; with a semi-colon" do
+    input = "&yuml;"
+    output = [["Character", "ÿ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zacute; with a semi-colon" do
+    input = "&zacute;"
+    output = [["Character", "ź"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zcaron; with a semi-colon" do
+    input = "&zcaron;"
+    output = [["Character", "ž"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zcy; with a semi-colon" do
+    input = "&zcy;"
+    output = [["Character", "з"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part43_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part43_test.exs
new file mode 100644
index 00000000..08d56c77
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part43_test.exs
@@ -0,0 +1,128 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart43Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Named entity: zdot; with a semi-colon" do
+    input = "&zdot;"
+    output = [["Character", "ż"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zeetrf; with a semi-colon" do
+    input = "&zeetrf;"
+    output = [["Character", "ℨ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zeta; with a semi-colon" do
+    input = "&zeta;"
+    output = [["Character", "ζ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zfr; with a semi-colon" do
+    input = "&zfr;"
+    output = [["Character", "𝔷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zhcy; with a semi-colon" do
+    input = "&zhcy;"
+    output = [["Character", "ж"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zigrarr; with a semi-colon" do
+    input = "&zigrarr;"
+    output = [["Character", "⇝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zopf; with a semi-colon" do
+    input = "&zopf;"
+    output = [["Character", "𝕫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zscr; with a semi-colon" do
+    input = "&zscr;"
+    output = [["Character", "𝓏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zwj; with a semi-colon" do
+    input = "&zwj;"
+    output = [["Character", "‍"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Named entity: zwnj; with a semi-colon" do
+    input = "&zwnj;"
+    output = [["Character", "‌"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part4_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part4_test.exs
new file mode 100644
index 00000000..21b96afe
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part4_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart4Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: NotGreaterLess without a semi-colon" do
+    input = "&NotGreaterLess"
+    output = [["Character", "&NotGreaterLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotGreaterSlantEqual without a semi-colon" do
+    input = "&NotGreaterSlantEqual"
+    output = [["Character", "&NotGreaterSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotGreaterTilde without a semi-colon" do
+    input = "&NotGreaterTilde"
+    output = [["Character", "&NotGreaterTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotHumpDownHump without a semi-colon" do
+    input = "&NotHumpDownHump"
+    output = [["Character", "&NotHumpDownHump"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotHumpEqual without a semi-colon" do
+    input = "&NotHumpEqual"
+    output = [["Character", "&NotHumpEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLeftTriangle without a semi-colon" do
+    input = "&NotLeftTriangle"
+    output = [["Character", "&NotLeftTriangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLeftTriangleBar without a semi-colon" do
+    input = "&NotLeftTriangleBar"
+    output = [["Character", "&NotLeftTriangleBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLeftTriangleEqual without a semi-colon" do
+    input = "&NotLeftTriangleEqual"
+    output = [["Character", "&NotLeftTriangleEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLess without a semi-colon" do
+    input = "&NotLess"
+    output = [["Character", "&NotLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLessEqual without a semi-colon" do
+    input = "&NotLessEqual"
+    output = [["Character", "&NotLessEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLessGreater without a semi-colon" do
+    input = "&NotLessGreater"
+    output = [["Character", "&NotLessGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLessLess without a semi-colon" do
+    input = "&NotLessLess"
+    output = [["Character", "&NotLessLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLessSlantEqual without a semi-colon" do
+    input = "&NotLessSlantEqual"
+    output = [["Character", "&NotLessSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotLessTilde without a semi-colon" do
+    input = "&NotLessTilde"
+    output = [["Character", "&NotLessTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotNestedGreaterGreater without a semi-colon" do
+    input = "&NotNestedGreaterGreater"
+    output = [["Character", "&NotNestedGreaterGreater"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotNestedLessLess without a semi-colon" do
+    input = "&NotNestedLessLess"
+    output = [["Character", "&NotNestedLessLess"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotPrecedes without a semi-colon" do
+    input = "&NotPrecedes"
+    output = [["Character", "&NotPrecedes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotPrecedesEqual without a semi-colon" do
+    input = "&NotPrecedesEqual"
+    output = [["Character", "&NotPrecedesEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotPrecedesSlantEqual without a semi-colon" do
+    input = "&NotPrecedesSlantEqual"
+    output = [["Character", "&NotPrecedesSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotReverseElement without a semi-colon" do
+    input = "&NotReverseElement"
+    output = [["Character", "&NotReverseElement"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotRightTriangle without a semi-colon" do
+    input = "&NotRightTriangle"
+    output = [["Character", "&NotRightTriangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotRightTriangleBar without a semi-colon" do
+    input = "&NotRightTriangleBar"
+    output = [["Character", "&NotRightTriangleBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotRightTriangleEqual without a semi-colon" do
+    input = "&NotRightTriangleEqual"
+    output = [["Character", "&NotRightTriangleEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSquareSubset without a semi-colon" do
+    input = "&NotSquareSubset"
+    output = [["Character", "&NotSquareSubset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSquareSubsetEqual without a semi-colon" do
+    input = "&NotSquareSubsetEqual"
+    output = [["Character", "&NotSquareSubsetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSquareSuperset without a semi-colon" do
+    input = "&NotSquareSuperset"
+    output = [["Character", "&NotSquareSuperset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSquareSupersetEqual without a semi-colon" do
+    input = "&NotSquareSupersetEqual"
+    output = [["Character", "&NotSquareSupersetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSubset without a semi-colon" do
+    input = "&NotSubset"
+    output = [["Character", "&NotSubset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSubsetEqual without a semi-colon" do
+    input = "&NotSubsetEqual"
+    output = [["Character", "&NotSubsetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSucceeds without a semi-colon" do
+    input = "&NotSucceeds"
+    output = [["Character", "&NotSucceeds"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSucceedsEqual without a semi-colon" do
+    input = "&NotSucceedsEqual"
+    output = [["Character", "&NotSucceedsEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSucceedsSlantEqual without a semi-colon" do
+    input = "&NotSucceedsSlantEqual"
+    output = [["Character", "&NotSucceedsSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSucceedsTilde without a semi-colon" do
+    input = "&NotSucceedsTilde"
+    output = [["Character", "&NotSucceedsTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSuperset without a semi-colon" do
+    input = "&NotSuperset"
+    output = [["Character", "&NotSuperset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotSupersetEqual without a semi-colon" do
+    input = "&NotSupersetEqual"
+    output = [["Character", "&NotSupersetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotTilde without a semi-colon" do
+    input = "&NotTilde"
+    output = [["Character", "&NotTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotTildeEqual without a semi-colon" do
+    input = "&NotTildeEqual"
+    output = [["Character", "&NotTildeEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotTildeFullEqual without a semi-colon" do
+    input = "&NotTildeFullEqual"
+    output = [["Character", "&NotTildeFullEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotTildeTilde without a semi-colon" do
+    input = "&NotTildeTilde"
+    output = [["Character", "&NotTildeTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: NotVerticalBar without a semi-colon" do
+    input = "&NotVerticalBar"
+    output = [["Character", "&NotVerticalBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Nscr without a semi-colon" do
+    input = "&Nscr"
+    output = [["Character", "&Nscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Nu without a semi-colon" do
+    input = "&Nu"
+    output = [["Character", "&Nu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OElig without a semi-colon" do
+    input = "&OElig"
+    output = [["Character", "&OElig"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ocy without a semi-colon" do
+    input = "&Ocy"
+    output = [["Character", "&Ocy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Odblac without a semi-colon" do
+    input = "&Odblac"
+    output = [["Character", "&Odblac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ofr without a semi-colon" do
+    input = "&Ofr"
+    output = [["Character", "&Ofr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Omacr without a semi-colon" do
+    input = "&Omacr"
+    output = [["Character", "&Omacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Omega without a semi-colon" do
+    input = "&Omega"
+    output = [["Character", "&Omega"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Omicron without a semi-colon" do
+    input = "&Omicron"
+    output = [["Character", "&Omicron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Oopf without a semi-colon" do
+    input = "&Oopf"
+    output = [["Character", "&Oopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OpenCurlyDoubleQuote without a semi-colon" do
+    input = "&OpenCurlyDoubleQuote"
+    output = [["Character", "&OpenCurlyDoubleQuote"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OpenCurlyQuote without a semi-colon" do
+    input = "&OpenCurlyQuote"
+    output = [["Character", "&OpenCurlyQuote"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Or without a semi-colon" do
+    input = "&Or"
+    output = [["Character", "&Or"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Oscr without a semi-colon" do
+    input = "&Oscr"
+    output = [["Character", "&Oscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Otimes without a semi-colon" do
+    input = "&Otimes"
+    output = [["Character", "&Otimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OverBar without a semi-colon" do
+    input = "&OverBar"
+    output = [["Character", "&OverBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OverBrace without a semi-colon" do
+    input = "&OverBrace"
+    output = [["Character", "&OverBrace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OverBracket without a semi-colon" do
+    input = "&OverBracket"
+    output = [["Character", "&OverBracket"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: OverParenthesis without a semi-colon" do
+    input = "&OverParenthesis"
+    output = [["Character", "&OverParenthesis"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: PartialD without a semi-colon" do
+    input = "&PartialD"
+    output = [["Character", "&PartialD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Pcy without a semi-colon" do
+    input = "&Pcy"
+    output = [["Character", "&Pcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Pfr without a semi-colon" do
+    input = "&Pfr"
+    output = [["Character", "&Pfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Phi without a semi-colon" do
+    input = "&Phi"
+    output = [["Character", "&Phi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Pi without a semi-colon" do
+    input = "&Pi"
+    output = [["Character", "&Pi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: PlusMinus without a semi-colon" do
+    input = "&PlusMinus"
+    output = [["Character", "&PlusMinus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Poincareplane without a semi-colon" do
+    input = "&Poincareplane"
+    output = [["Character", "&Poincareplane"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Popf without a semi-colon" do
+    input = "&Popf"
+    output = [["Character", "&Popf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Pr without a semi-colon" do
+    input = "&Pr"
+    output = [["Character", "&Pr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Precedes without a semi-colon" do
+    input = "&Precedes"
+    output = [["Character", "&Precedes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: PrecedesEqual without a semi-colon" do
+    input = "&PrecedesEqual"
+    output = [["Character", "&PrecedesEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: PrecedesSlantEqual without a semi-colon" do
+    input = "&PrecedesSlantEqual"
+    output = [["Character", "&PrecedesSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: PrecedesTilde without a semi-colon" do
+    input = "&PrecedesTilde"
+    output = [["Character", "&PrecedesTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Prime without a semi-colon" do
+    input = "&Prime"
+    output = [["Character", "&Prime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Product without a semi-colon" do
+    input = "&Product"
+    output = [["Character", "&Product"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Proportion without a semi-colon" do
+    input = "&Proportion"
+    output = [["Character", "&Proportion"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Proportional without a semi-colon" do
+    input = "&Proportional"
+    output = [["Character", "&Proportional"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Pscr without a semi-colon" do
+    input = "&Pscr"
+    output = [["Character", "&Pscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Psi without a semi-colon" do
+    input = "&Psi"
+    output = [["Character", "&Psi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Qfr without a semi-colon" do
+    input = "&Qfr"
+    output = [["Character", "&Qfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Qopf without a semi-colon" do
+    input = "&Qopf"
+    output = [["Character", "&Qopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Qscr without a semi-colon" do
+    input = "&Qscr"
+    output = [["Character", "&Qscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RBarr without a semi-colon" do
+    input = "&RBarr"
+    output = [["Character", "&RBarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Racute without a semi-colon" do
+    input = "&Racute"
+    output = [["Character", "&Racute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rang without a semi-colon" do
+    input = "&Rang"
+    output = [["Character", "&Rang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rarr without a semi-colon" do
+    input = "&Rarr"
+    output = [["Character", "&Rarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rarrtl without a semi-colon" do
+    input = "&Rarrtl"
+    output = [["Character", "&Rarrtl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rcaron without a semi-colon" do
+    input = "&Rcaron"
+    output = [["Character", "&Rcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rcedil without a semi-colon" do
+    input = "&Rcedil"
+    output = [["Character", "&Rcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rcy without a semi-colon" do
+    input = "&Rcy"
+    output = [["Character", "&Rcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Re without a semi-colon" do
+    input = "&Re"
+    output = [["Character", "&Re"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ReverseElement without a semi-colon" do
+    input = "&ReverseElement"
+    output = [["Character", "&ReverseElement"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ReverseEquilibrium without a semi-colon" do
+    input = "&ReverseEquilibrium"
+    output = [["Character", "&ReverseEquilibrium"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ReverseUpEquilibrium without a semi-colon" do
+    input = "&ReverseUpEquilibrium"
+    output = [["Character", "&ReverseUpEquilibrium"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rfr without a semi-colon" do
+    input = "&Rfr"
+    output = [["Character", "&Rfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rho without a semi-colon" do
+    input = "&Rho"
+    output = [["Character", "&Rho"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightAngleBracket without a semi-colon" do
+    input = "&RightAngleBracket"
+    output = [["Character", "&RightAngleBracket"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightArrow without a semi-colon" do
+    input = "&RightArrow"
+    output = [["Character", "&RightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightArrowBar without a semi-colon" do
+    input = "&RightArrowBar"
+    output = [["Character", "&RightArrowBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightArrowLeftArrow without a semi-colon" do
+    input = "&RightArrowLeftArrow"
+    output = [["Character", "&RightArrowLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightCeiling without a semi-colon" do
+    input = "&RightCeiling"
+    output = [["Character", "&RightCeiling"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part5_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part5_test.exs
new file mode 100644
index 00000000..427f46de
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part5_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart5Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: RightDoubleBracket without a semi-colon" do
+    input = "&RightDoubleBracket"
+    output = [["Character", "&RightDoubleBracket"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightDownTeeVector without a semi-colon" do
+    input = "&RightDownTeeVector"
+    output = [["Character", "&RightDownTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightDownVector without a semi-colon" do
+    input = "&RightDownVector"
+    output = [["Character", "&RightDownVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightDownVectorBar without a semi-colon" do
+    input = "&RightDownVectorBar"
+    output = [["Character", "&RightDownVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightFloor without a semi-colon" do
+    input = "&RightFloor"
+    output = [["Character", "&RightFloor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightTee without a semi-colon" do
+    input = "&RightTee"
+    output = [["Character", "&RightTee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightTeeArrow without a semi-colon" do
+    input = "&RightTeeArrow"
+    output = [["Character", "&RightTeeArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightTeeVector without a semi-colon" do
+    input = "&RightTeeVector"
+    output = [["Character", "&RightTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightTriangle without a semi-colon" do
+    input = "&RightTriangle"
+    output = [["Character", "&RightTriangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightTriangleBar without a semi-colon" do
+    input = "&RightTriangleBar"
+    output = [["Character", "&RightTriangleBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightTriangleEqual without a semi-colon" do
+    input = "&RightTriangleEqual"
+    output = [["Character", "&RightTriangleEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightUpDownVector without a semi-colon" do
+    input = "&RightUpDownVector"
+    output = [["Character", "&RightUpDownVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightUpTeeVector without a semi-colon" do
+    input = "&RightUpTeeVector"
+    output = [["Character", "&RightUpTeeVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightUpVector without a semi-colon" do
+    input = "&RightUpVector"
+    output = [["Character", "&RightUpVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightUpVectorBar without a semi-colon" do
+    input = "&RightUpVectorBar"
+    output = [["Character", "&RightUpVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightVector without a semi-colon" do
+    input = "&RightVector"
+    output = [["Character", "&RightVector"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RightVectorBar without a semi-colon" do
+    input = "&RightVectorBar"
+    output = [["Character", "&RightVectorBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rightarrow without a semi-colon" do
+    input = "&Rightarrow"
+    output = [["Character", "&Rightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ropf without a semi-colon" do
+    input = "&Ropf"
+    output = [["Character", "&Ropf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RoundImplies without a semi-colon" do
+    input = "&RoundImplies"
+    output = [["Character", "&RoundImplies"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rrightarrow without a semi-colon" do
+    input = "&Rrightarrow"
+    output = [["Character", "&Rrightarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rscr without a semi-colon" do
+    input = "&Rscr"
+    output = [["Character", "&Rscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Rsh without a semi-colon" do
+    input = "&Rsh"
+    output = [["Character", "&Rsh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: RuleDelayed without a semi-colon" do
+    input = "&RuleDelayed"
+    output = [["Character", "&RuleDelayed"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SHCHcy without a semi-colon" do
+    input = "&SHCHcy"
+    output = [["Character", "&SHCHcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SHcy without a semi-colon" do
+    input = "&SHcy"
+    output = [["Character", "&SHcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SOFTcy without a semi-colon" do
+    input = "&SOFTcy"
+    output = [["Character", "&SOFTcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sacute without a semi-colon" do
+    input = "&Sacute"
+    output = [["Character", "&Sacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sc without a semi-colon" do
+    input = "&Sc"
+    output = [["Character", "&Sc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Scaron without a semi-colon" do
+    input = "&Scaron"
+    output = [["Character", "&Scaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Scedil without a semi-colon" do
+    input = "&Scedil"
+    output = [["Character", "&Scedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Scirc without a semi-colon" do
+    input = "&Scirc"
+    output = [["Character", "&Scirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Scy without a semi-colon" do
+    input = "&Scy"
+    output = [["Character", "&Scy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sfr without a semi-colon" do
+    input = "&Sfr"
+    output = [["Character", "&Sfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ShortDownArrow without a semi-colon" do
+    input = "&ShortDownArrow"
+    output = [["Character", "&ShortDownArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ShortLeftArrow without a semi-colon" do
+    input = "&ShortLeftArrow"
+    output = [["Character", "&ShortLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ShortRightArrow without a semi-colon" do
+    input = "&ShortRightArrow"
+    output = [["Character", "&ShortRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ShortUpArrow without a semi-colon" do
+    input = "&ShortUpArrow"
+    output = [["Character", "&ShortUpArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sigma without a semi-colon" do
+    input = "&Sigma"
+    output = [["Character", "&Sigma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SmallCircle without a semi-colon" do
+    input = "&SmallCircle"
+    output = [["Character", "&SmallCircle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sopf without a semi-colon" do
+    input = "&Sopf"
+    output = [["Character", "&Sopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sqrt without a semi-colon" do
+    input = "&Sqrt"
+    output = [["Character", "&Sqrt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Square without a semi-colon" do
+    input = "&Square"
+    output = [["Character", "&Square"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SquareIntersection without a semi-colon" do
+    input = "&SquareIntersection"
+    output = [["Character", "&SquareIntersection"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SquareSubset without a semi-colon" do
+    input = "&SquareSubset"
+    output = [["Character", "&SquareSubset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SquareSubsetEqual without a semi-colon" do
+    input = "&SquareSubsetEqual"
+    output = [["Character", "&SquareSubsetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SquareSuperset without a semi-colon" do
+    input = "&SquareSuperset"
+    output = [["Character", "&SquareSuperset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SquareSupersetEqual without a semi-colon" do
+    input = "&SquareSupersetEqual"
+    output = [["Character", "&SquareSupersetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SquareUnion without a semi-colon" do
+    input = "&SquareUnion"
+    output = [["Character", "&SquareUnion"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sscr without a semi-colon" do
+    input = "&Sscr"
+    output = [["Character", "&Sscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Star without a semi-colon" do
+    input = "&Star"
+    output = [["Character", "&Star"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sub without a semi-colon" do
+    input = "&Sub"
+    output = [["Character", "&Sub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Subset without a semi-colon" do
+    input = "&Subset"
+    output = [["Character", "&Subset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SubsetEqual without a semi-colon" do
+    input = "&SubsetEqual"
+    output = [["Character", "&SubsetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Succeeds without a semi-colon" do
+    input = "&Succeeds"
+    output = [["Character", "&Succeeds"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SucceedsEqual without a semi-colon" do
+    input = "&SucceedsEqual"
+    output = [["Character", "&SucceedsEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SucceedsSlantEqual without a semi-colon" do
+    input = "&SucceedsSlantEqual"
+    output = [["Character", "&SucceedsSlantEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SucceedsTilde without a semi-colon" do
+    input = "&SucceedsTilde"
+    output = [["Character", "&SucceedsTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SuchThat without a semi-colon" do
+    input = "&SuchThat"
+    output = [["Character", "&SuchThat"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sum without a semi-colon" do
+    input = "&Sum"
+    output = [["Character", "&Sum"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Sup without a semi-colon" do
+    input = "&Sup"
+    output = [["Character", "&Sup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Superset without a semi-colon" do
+    input = "&Superset"
+    output = [["Character", "&Superset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: SupersetEqual without a semi-colon" do
+    input = "&SupersetEqual"
+    output = [["Character", "&SupersetEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Supset without a semi-colon" do
+    input = "&Supset"
+    output = [["Character", "&Supset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TRADE without a semi-colon" do
+    input = "&TRADE"
+    output = [["Character", "&TRADE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TSHcy without a semi-colon" do
+    input = "&TSHcy"
+    output = [["Character", "&TSHcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TScy without a semi-colon" do
+    input = "&TScy"
+    output = [["Character", "&TScy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tab without a semi-colon" do
+    input = "&Tab"
+    output = [["Character", "&Tab"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tau without a semi-colon" do
+    input = "&Tau"
+    output = [["Character", "&Tau"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tcaron without a semi-colon" do
+    input = "&Tcaron"
+    output = [["Character", "&Tcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tcedil without a semi-colon" do
+    input = "&Tcedil"
+    output = [["Character", "&Tcedil"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tcy without a semi-colon" do
+    input = "&Tcy"
+    output = [["Character", "&Tcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tfr without a semi-colon" do
+    input = "&Tfr"
+    output = [["Character", "&Tfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Therefore without a semi-colon" do
+    input = "&Therefore"
+    output = [["Character", "&Therefore"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Theta without a semi-colon" do
+    input = "&Theta"
+    output = [["Character", "&Theta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ThickSpace without a semi-colon" do
+    input = "&ThickSpace"
+    output = [["Character", "&ThickSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ThinSpace without a semi-colon" do
+    input = "&ThinSpace"
+    output = [["Character", "&ThinSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tilde without a semi-colon" do
+    input = "&Tilde"
+    output = [["Character", "&Tilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TildeEqual without a semi-colon" do
+    input = "&TildeEqual"
+    output = [["Character", "&TildeEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TildeFullEqual without a semi-colon" do
+    input = "&TildeFullEqual"
+    output = [["Character", "&TildeFullEqual"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TildeTilde without a semi-colon" do
+    input = "&TildeTilde"
+    output = [["Character", "&TildeTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Topf without a semi-colon" do
+    input = "&Topf"
+    output = [["Character", "&Topf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: TripleDot without a semi-colon" do
+    input = "&TripleDot"
+    output = [["Character", "&TripleDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tscr without a semi-colon" do
+    input = "&Tscr"
+    output = [["Character", "&Tscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Tstrok without a semi-colon" do
+    input = "&Tstrok"
+    output = [["Character", "&Tstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Uarr without a semi-colon" do
+    input = "&Uarr"
+    output = [["Character", "&Uarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Uarrocir without a semi-colon" do
+    input = "&Uarrocir"
+    output = [["Character", "&Uarrocir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ubrcy without a semi-colon" do
+    input = "&Ubrcy"
+    output = [["Character", "&Ubrcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ubreve without a semi-colon" do
+    input = "&Ubreve"
+    output = [["Character", "&Ubreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ucy without a semi-colon" do
+    input = "&Ucy"
+    output = [["Character", "&Ucy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Udblac without a semi-colon" do
+    input = "&Udblac"
+    output = [["Character", "&Udblac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ufr without a semi-colon" do
+    input = "&Ufr"
+    output = [["Character", "&Ufr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Umacr without a semi-colon" do
+    input = "&Umacr"
+    output = [["Character", "&Umacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UnderBar without a semi-colon" do
+    input = "&UnderBar"
+    output = [["Character", "&UnderBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UnderBrace without a semi-colon" do
+    input = "&UnderBrace"
+    output = [["Character", "&UnderBrace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UnderBracket without a semi-colon" do
+    input = "&UnderBracket"
+    output = [["Character", "&UnderBracket"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UnderParenthesis without a semi-colon" do
+    input = "&UnderParenthesis"
+    output = [["Character", "&UnderParenthesis"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Union without a semi-colon" do
+    input = "&Union"
+    output = [["Character", "&Union"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UnionPlus without a semi-colon" do
+    input = "&UnionPlus"
+    output = [["Character", "&UnionPlus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Uogon without a semi-colon" do
+    input = "&Uogon"
+    output = [["Character", "&Uogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part6_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part6_test.exs
new file mode 100644
index 00000000..6c34fecc
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part6_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart6Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: Uopf without a semi-colon" do
+    input = "&Uopf"
+    output = [["Character", "&Uopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpArrow without a semi-colon" do
+    input = "&UpArrow"
+    output = [["Character", "&UpArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpArrowBar without a semi-colon" do
+    input = "&UpArrowBar"
+    output = [["Character", "&UpArrowBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpArrowDownArrow without a semi-colon" do
+    input = "&UpArrowDownArrow"
+    output = [["Character", "&UpArrowDownArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpDownArrow without a semi-colon" do
+    input = "&UpDownArrow"
+    output = [["Character", "&UpDownArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpEquilibrium without a semi-colon" do
+    input = "&UpEquilibrium"
+    output = [["Character", "&UpEquilibrium"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpTee without a semi-colon" do
+    input = "&UpTee"
+    output = [["Character", "&UpTee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpTeeArrow without a semi-colon" do
+    input = "&UpTeeArrow"
+    output = [["Character", "&UpTeeArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Uparrow without a semi-colon" do
+    input = "&Uparrow"
+    output = [["Character", "&Uparrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Updownarrow without a semi-colon" do
+    input = "&Updownarrow"
+    output = [["Character", "&Updownarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpperLeftArrow without a semi-colon" do
+    input = "&UpperLeftArrow"
+    output = [["Character", "&UpperLeftArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: UpperRightArrow without a semi-colon" do
+    input = "&UpperRightArrow"
+    output = [["Character", "&UpperRightArrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Upsi without a semi-colon" do
+    input = "&Upsi"
+    output = [["Character", "&Upsi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Upsilon without a semi-colon" do
+    input = "&Upsilon"
+    output = [["Character", "&Upsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Uring without a semi-colon" do
+    input = "&Uring"
+    output = [["Character", "&Uring"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Uscr without a semi-colon" do
+    input = "&Uscr"
+    output = [["Character", "&Uscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Utilde without a semi-colon" do
+    input = "&Utilde"
+    output = [["Character", "&Utilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: VDash without a semi-colon" do
+    input = "&VDash"
+    output = [["Character", "&VDash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vbar without a semi-colon" do
+    input = "&Vbar"
+    output = [["Character", "&Vbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vcy without a semi-colon" do
+    input = "&Vcy"
+    output = [["Character", "&Vcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vdash without a semi-colon" do
+    input = "&Vdash"
+    output = [["Character", "&Vdash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vdashl without a semi-colon" do
+    input = "&Vdashl"
+    output = [["Character", "&Vdashl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vee without a semi-colon" do
+    input = "&Vee"
+    output = [["Character", "&Vee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Verbar without a semi-colon" do
+    input = "&Verbar"
+    output = [["Character", "&Verbar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vert without a semi-colon" do
+    input = "&Vert"
+    output = [["Character", "&Vert"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: VerticalBar without a semi-colon" do
+    input = "&VerticalBar"
+    output = [["Character", "&VerticalBar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: VerticalLine without a semi-colon" do
+    input = "&VerticalLine"
+    output = [["Character", "&VerticalLine"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: VerticalSeparator without a semi-colon" do
+    input = "&VerticalSeparator"
+    output = [["Character", "&VerticalSeparator"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: VerticalTilde without a semi-colon" do
+    input = "&VerticalTilde"
+    output = [["Character", "&VerticalTilde"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: VeryThinSpace without a semi-colon" do
+    input = "&VeryThinSpace"
+    output = [["Character", "&VeryThinSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vfr without a semi-colon" do
+    input = "&Vfr"
+    output = [["Character", "&Vfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vopf without a semi-colon" do
+    input = "&Vopf"
+    output = [["Character", "&Vopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vscr without a semi-colon" do
+    input = "&Vscr"
+    output = [["Character", "&Vscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Vvdash without a semi-colon" do
+    input = "&Vvdash"
+    output = [["Character", "&Vvdash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Wcirc without a semi-colon" do
+    input = "&Wcirc"
+    output = [["Character", "&Wcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Wedge without a semi-colon" do
+    input = "&Wedge"
+    output = [["Character", "&Wedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Wfr without a semi-colon" do
+    input = "&Wfr"
+    output = [["Character", "&Wfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Wopf without a semi-colon" do
+    input = "&Wopf"
+    output = [["Character", "&Wopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Wscr without a semi-colon" do
+    input = "&Wscr"
+    output = [["Character", "&Wscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Xfr without a semi-colon" do
+    input = "&Xfr"
+    output = [["Character", "&Xfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Xi without a semi-colon" do
+    input = "&Xi"
+    output = [["Character", "&Xi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Xopf without a semi-colon" do
+    input = "&Xopf"
+    output = [["Character", "&Xopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Xscr without a semi-colon" do
+    input = "&Xscr"
+    output = [["Character", "&Xscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: YAcy without a semi-colon" do
+    input = "&YAcy"
+    output = [["Character", "&YAcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: YIcy without a semi-colon" do
+    input = "&YIcy"
+    output = [["Character", "&YIcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: YUcy without a semi-colon" do
+    input = "&YUcy"
+    output = [["Character", "&YUcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ycirc without a semi-colon" do
+    input = "&Ycirc"
+    output = [["Character", "&Ycirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Ycy without a semi-colon" do
+    input = "&Ycy"
+    output = [["Character", "&Ycy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Yfr without a semi-colon" do
+    input = "&Yfr"
+    output = [["Character", "&Yfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Yopf without a semi-colon" do
+    input = "&Yopf"
+    output = [["Character", "&Yopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Yscr without a semi-colon" do
+    input = "&Yscr"
+    output = [["Character", "&Yscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Yuml without a semi-colon" do
+    input = "&Yuml"
+    output = [["Character", "&Yuml"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ZHcy without a semi-colon" do
+    input = "&ZHcy"
+    output = [["Character", "&ZHcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zacute without a semi-colon" do
+    input = "&Zacute"
+    output = [["Character", "&Zacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zcaron without a semi-colon" do
+    input = "&Zcaron"
+    output = [["Character", "&Zcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zcy without a semi-colon" do
+    input = "&Zcy"
+    output = [["Character", "&Zcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zdot without a semi-colon" do
+    input = "&Zdot"
+    output = [["Character", "&Zdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ZeroWidthSpace without a semi-colon" do
+    input = "&ZeroWidthSpace"
+    output = [["Character", "&ZeroWidthSpace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zeta without a semi-colon" do
+    input = "&Zeta"
+    output = [["Character", "&Zeta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zfr without a semi-colon" do
+    input = "&Zfr"
+    output = [["Character", "&Zfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zopf without a semi-colon" do
+    input = "&Zopf"
+    output = [["Character", "&Zopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: Zscr without a semi-colon" do
+    input = "&Zscr"
+    output = [["Character", "&Zscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: abreve without a semi-colon" do
+    input = "&abreve"
+    output = [["Character", "&abreve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ac without a semi-colon" do
+    input = "&ac"
+    output = [["Character", "&ac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: acE without a semi-colon" do
+    input = "&acE"
+    output = [["Character", "&acE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: acd without a semi-colon" do
+    input = "&acd"
+    output = [["Character", "&acd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: acy without a semi-colon" do
+    input = "&acy"
+    output = [["Character", "&acy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: af without a semi-colon" do
+    input = "&af"
+    output = [["Character", "&af"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: afr without a semi-colon" do
+    input = "&afr"
+    output = [["Character", "&afr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: alefsym without a semi-colon" do
+    input = "&alefsym"
+    output = [["Character", "&alefsym"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: aleph without a semi-colon" do
+    input = "&aleph"
+    output = [["Character", "&aleph"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: alpha without a semi-colon" do
+    input = "&alpha"
+    output = [["Character", "&alpha"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: amacr without a semi-colon" do
+    input = "&amacr"
+    output = [["Character", "&amacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: amalg without a semi-colon" do
+    input = "&amalg"
+    output = [["Character", "&amalg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: and without a semi-colon" do
+    input = "&and"
+    output = [["Character", "&and"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: andand without a semi-colon" do
+    input = "&andand"
+    output = [["Character", "&andand"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: andd without a semi-colon" do
+    input = "&andd"
+    output = [["Character", "&andd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: andslope without a semi-colon" do
+    input = "&andslope"
+    output = [["Character", "&andslope"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: andv without a semi-colon" do
+    input = "&andv"
+    output = [["Character", "&andv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ang without a semi-colon" do
+    input = "&ang"
+    output = [["Character", "&ang"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ange without a semi-colon" do
+    input = "&ange"
+    output = [["Character", "&ange"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angle without a semi-colon" do
+    input = "&angle"
+    output = [["Character", "&angle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsd without a semi-colon" do
+    input = "&angmsd"
+    output = [["Character", "&angmsd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdaa without a semi-colon" do
+    input = "&angmsdaa"
+    output = [["Character", "&angmsdaa"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdab without a semi-colon" do
+    input = "&angmsdab"
+    output = [["Character", "&angmsdab"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdac without a semi-colon" do
+    input = "&angmsdac"
+    output = [["Character", "&angmsdac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdad without a semi-colon" do
+    input = "&angmsdad"
+    output = [["Character", "&angmsdad"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdae without a semi-colon" do
+    input = "&angmsdae"
+    output = [["Character", "&angmsdae"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdaf without a semi-colon" do
+    input = "&angmsdaf"
+    output = [["Character", "&angmsdaf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdag without a semi-colon" do
+    input = "&angmsdag"
+    output = [["Character", "&angmsdag"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angmsdah without a semi-colon" do
+    input = "&angmsdah"
+    output = [["Character", "&angmsdah"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angrt without a semi-colon" do
+    input = "&angrt"
+    output = [["Character", "&angrt"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angrtvb without a semi-colon" do
+    input = "&angrtvb"
+    output = [["Character", "&angrtvb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angrtvbd without a semi-colon" do
+    input = "&angrtvbd"
+    output = [["Character", "&angrtvbd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angsph without a semi-colon" do
+    input = "&angsph"
+    output = [["Character", "&angsph"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angst without a semi-colon" do
+    input = "&angst"
+    output = [["Character", "&angst"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: angzarr without a semi-colon" do
+    input = "&angzarr"
+    output = [["Character", "&angzarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: aogon without a semi-colon" do
+    input = "&aogon"
+    output = [["Character", "&aogon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: aopf without a semi-colon" do
+    input = "&aopf"
+    output = [["Character", "&aopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ap without a semi-colon" do
+    input = "&ap"
+    output = [["Character", "&ap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part7_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part7_test.exs
new file mode 100644
index 00000000..af887045
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part7_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart7Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: apE without a semi-colon" do
+    input = "&apE"
+    output = [["Character", "&apE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: apacir without a semi-colon" do
+    input = "&apacir"
+    output = [["Character", "&apacir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ape without a semi-colon" do
+    input = "&ape"
+    output = [["Character", "&ape"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: apid without a semi-colon" do
+    input = "&apid"
+    output = [["Character", "&apid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: apos without a semi-colon" do
+    input = "&apos"
+    output = [["Character", "&apos"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: approx without a semi-colon" do
+    input = "&approx"
+    output = [["Character", "&approx"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: approxeq without a semi-colon" do
+    input = "&approxeq"
+    output = [["Character", "&approxeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ascr without a semi-colon" do
+    input = "&ascr"
+    output = [["Character", "&ascr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ast without a semi-colon" do
+    input = "&ast"
+    output = [["Character", "&ast"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: asymp without a semi-colon" do
+    input = "&asymp"
+    output = [["Character", "&asymp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: asympeq without a semi-colon" do
+    input = "&asympeq"
+    output = [["Character", "&asympeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: awconint without a semi-colon" do
+    input = "&awconint"
+    output = [["Character", "&awconint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: awint without a semi-colon" do
+    input = "&awint"
+    output = [["Character", "&awint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bNot without a semi-colon" do
+    input = "&bNot"
+    output = [["Character", "&bNot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: backcong without a semi-colon" do
+    input = "&backcong"
+    output = [["Character", "&backcong"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: backepsilon without a semi-colon" do
+    input = "&backepsilon"
+    output = [["Character", "&backepsilon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: backprime without a semi-colon" do
+    input = "&backprime"
+    output = [["Character", "&backprime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: backsim without a semi-colon" do
+    input = "&backsim"
+    output = [["Character", "&backsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: backsimeq without a semi-colon" do
+    input = "&backsimeq"
+    output = [["Character", "&backsimeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: barvee without a semi-colon" do
+    input = "&barvee"
+    output = [["Character", "&barvee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: barwed without a semi-colon" do
+    input = "&barwed"
+    output = [["Character", "&barwed"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: barwedge without a semi-colon" do
+    input = "&barwedge"
+    output = [["Character", "&barwedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bbrk without a semi-colon" do
+    input = "&bbrk"
+    output = [["Character", "&bbrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bbrktbrk without a semi-colon" do
+    input = "&bbrktbrk"
+    output = [["Character", "&bbrktbrk"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bcong without a semi-colon" do
+    input = "&bcong"
+    output = [["Character", "&bcong"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bcy without a semi-colon" do
+    input = "&bcy"
+    output = [["Character", "&bcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bdquo without a semi-colon" do
+    input = "&bdquo"
+    output = [["Character", "&bdquo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: becaus without a semi-colon" do
+    input = "&becaus"
+    output = [["Character", "&becaus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: because without a semi-colon" do
+    input = "&because"
+    output = [["Character", "&because"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bemptyv without a semi-colon" do
+    input = "&bemptyv"
+    output = [["Character", "&bemptyv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bepsi without a semi-colon" do
+    input = "&bepsi"
+    output = [["Character", "&bepsi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bernou without a semi-colon" do
+    input = "&bernou"
+    output = [["Character", "&bernou"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: beta without a semi-colon" do
+    input = "&beta"
+    output = [["Character", "&beta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: beth without a semi-colon" do
+    input = "&beth"
+    output = [["Character", "&beth"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: between without a semi-colon" do
+    input = "&between"
+    output = [["Character", "&between"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bfr without a semi-colon" do
+    input = "&bfr"
+    output = [["Character", "&bfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigcap without a semi-colon" do
+    input = "&bigcap"
+    output = [["Character", "&bigcap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigcirc without a semi-colon" do
+    input = "&bigcirc"
+    output = [["Character", "&bigcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigcup without a semi-colon" do
+    input = "&bigcup"
+    output = [["Character", "&bigcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigodot without a semi-colon" do
+    input = "&bigodot"
+    output = [["Character", "&bigodot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigoplus without a semi-colon" do
+    input = "&bigoplus"
+    output = [["Character", "&bigoplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigotimes without a semi-colon" do
+    input = "&bigotimes"
+    output = [["Character", "&bigotimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigsqcup without a semi-colon" do
+    input = "&bigsqcup"
+    output = [["Character", "&bigsqcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigstar without a semi-colon" do
+    input = "&bigstar"
+    output = [["Character", "&bigstar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigtriangledown without a semi-colon" do
+    input = "&bigtriangledown"
+    output = [["Character", "&bigtriangledown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigtriangleup without a semi-colon" do
+    input = "&bigtriangleup"
+    output = [["Character", "&bigtriangleup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: biguplus without a semi-colon" do
+    input = "&biguplus"
+    output = [["Character", "&biguplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigvee without a semi-colon" do
+    input = "&bigvee"
+    output = [["Character", "&bigvee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bigwedge without a semi-colon" do
+    input = "&bigwedge"
+    output = [["Character", "&bigwedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bkarow without a semi-colon" do
+    input = "&bkarow"
+    output = [["Character", "&bkarow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blacklozenge without a semi-colon" do
+    input = "&blacklozenge"
+    output = [["Character", "&blacklozenge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blacksquare without a semi-colon" do
+    input = "&blacksquare"
+    output = [["Character", "&blacksquare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blacktriangle without a semi-colon" do
+    input = "&blacktriangle"
+    output = [["Character", "&blacktriangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blacktriangledown without a semi-colon" do
+    input = "&blacktriangledown"
+    output = [["Character", "&blacktriangledown"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blacktriangleleft without a semi-colon" do
+    input = "&blacktriangleleft"
+    output = [["Character", "&blacktriangleleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blacktriangleright without a semi-colon" do
+    input = "&blacktriangleright"
+    output = [["Character", "&blacktriangleright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blank without a semi-colon" do
+    input = "&blank"
+    output = [["Character", "&blank"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blk12 without a semi-colon" do
+    input = "&blk12"
+    output = [["Character", "&blk12"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blk14 without a semi-colon" do
+    input = "&blk14"
+    output = [["Character", "&blk14"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: blk34 without a semi-colon" do
+    input = "&blk34"
+    output = [["Character", "&blk34"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: block without a semi-colon" do
+    input = "&block"
+    output = [["Character", "&block"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bne without a semi-colon" do
+    input = "&bne"
+    output = [["Character", "&bne"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bnequiv without a semi-colon" do
+    input = "&bnequiv"
+    output = [["Character", "&bnequiv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bnot without a semi-colon" do
+    input = "&bnot"
+    output = [["Character", "&bnot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bopf without a semi-colon" do
+    input = "&bopf"
+    output = [["Character", "&bopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bot without a semi-colon" do
+    input = "&bot"
+    output = [["Character", "&bot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bottom without a semi-colon" do
+    input = "&bottom"
+    output = [["Character", "&bottom"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bowtie without a semi-colon" do
+    input = "&bowtie"
+    output = [["Character", "&bowtie"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxDL without a semi-colon" do
+    input = "&boxDL"
+    output = [["Character", "&boxDL"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxDR without a semi-colon" do
+    input = "&boxDR"
+    output = [["Character", "&boxDR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxDl without a semi-colon" do
+    input = "&boxDl"
+    output = [["Character", "&boxDl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxDr without a semi-colon" do
+    input = "&boxDr"
+    output = [["Character", "&boxDr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxH without a semi-colon" do
+    input = "&boxH"
+    output = [["Character", "&boxH"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxHD without a semi-colon" do
+    input = "&boxHD"
+    output = [["Character", "&boxHD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxHU without a semi-colon" do
+    input = "&boxHU"
+    output = [["Character", "&boxHU"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxHd without a semi-colon" do
+    input = "&boxHd"
+    output = [["Character", "&boxHd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxHu without a semi-colon" do
+    input = "&boxHu"
+    output = [["Character", "&boxHu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxUL without a semi-colon" do
+    input = "&boxUL"
+    output = [["Character", "&boxUL"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxUR without a semi-colon" do
+    input = "&boxUR"
+    output = [["Character", "&boxUR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxUl without a semi-colon" do
+    input = "&boxUl"
+    output = [["Character", "&boxUl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxUr without a semi-colon" do
+    input = "&boxUr"
+    output = [["Character", "&boxUr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxV without a semi-colon" do
+    input = "&boxV"
+    output = [["Character", "&boxV"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxVH without a semi-colon" do
+    input = "&boxVH"
+    output = [["Character", "&boxVH"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxVL without a semi-colon" do
+    input = "&boxVL"
+    output = [["Character", "&boxVL"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxVR without a semi-colon" do
+    input = "&boxVR"
+    output = [["Character", "&boxVR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxVh without a semi-colon" do
+    input = "&boxVh"
+    output = [["Character", "&boxVh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxVl without a semi-colon" do
+    input = "&boxVl"
+    output = [["Character", "&boxVl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxVr without a semi-colon" do
+    input = "&boxVr"
+    output = [["Character", "&boxVr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxbox without a semi-colon" do
+    input = "&boxbox"
+    output = [["Character", "&boxbox"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxdL without a semi-colon" do
+    input = "&boxdL"
+    output = [["Character", "&boxdL"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxdR without a semi-colon" do
+    input = "&boxdR"
+    output = [["Character", "&boxdR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxdl without a semi-colon" do
+    input = "&boxdl"
+    output = [["Character", "&boxdl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxdr without a semi-colon" do
+    input = "&boxdr"
+    output = [["Character", "&boxdr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxh without a semi-colon" do
+    input = "&boxh"
+    output = [["Character", "&boxh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxhD without a semi-colon" do
+    input = "&boxhD"
+    output = [["Character", "&boxhD"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxhU without a semi-colon" do
+    input = "&boxhU"
+    output = [["Character", "&boxhU"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxhd without a semi-colon" do
+    input = "&boxhd"
+    output = [["Character", "&boxhd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxhu without a semi-colon" do
+    input = "&boxhu"
+    output = [["Character", "&boxhu"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxminus without a semi-colon" do
+    input = "&boxminus"
+    output = [["Character", "&boxminus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxplus without a semi-colon" do
+    input = "&boxplus"
+    output = [["Character", "&boxplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part8_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part8_test.exs
new file mode 100644
index 00000000..0ae4c8fc
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part8_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart8Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: boxtimes without a semi-colon" do
+    input = "&boxtimes"
+    output = [["Character", "&boxtimes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxuL without a semi-colon" do
+    input = "&boxuL"
+    output = [["Character", "&boxuL"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxuR without a semi-colon" do
+    input = "&boxuR"
+    output = [["Character", "&boxuR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxul without a semi-colon" do
+    input = "&boxul"
+    output = [["Character", "&boxul"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxur without a semi-colon" do
+    input = "&boxur"
+    output = [["Character", "&boxur"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxv without a semi-colon" do
+    input = "&boxv"
+    output = [["Character", "&boxv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxvH without a semi-colon" do
+    input = "&boxvH"
+    output = [["Character", "&boxvH"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxvL without a semi-colon" do
+    input = "&boxvL"
+    output = [["Character", "&boxvL"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxvR without a semi-colon" do
+    input = "&boxvR"
+    output = [["Character", "&boxvR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxvh without a semi-colon" do
+    input = "&boxvh"
+    output = [["Character", "&boxvh"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxvl without a semi-colon" do
+    input = "&boxvl"
+    output = [["Character", "&boxvl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: boxvr without a semi-colon" do
+    input = "&boxvr"
+    output = [["Character", "&boxvr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bprime without a semi-colon" do
+    input = "&bprime"
+    output = [["Character", "&bprime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: breve without a semi-colon" do
+    input = "&breve"
+    output = [["Character", "&breve"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bscr without a semi-colon" do
+    input = "&bscr"
+    output = [["Character", "&bscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bsemi without a semi-colon" do
+    input = "&bsemi"
+    output = [["Character", "&bsemi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bsim without a semi-colon" do
+    input = "&bsim"
+    output = [["Character", "&bsim"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bsime without a semi-colon" do
+    input = "&bsime"
+    output = [["Character", "&bsime"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bsol without a semi-colon" do
+    input = "&bsol"
+    output = [["Character", "&bsol"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bsolb without a semi-colon" do
+    input = "&bsolb"
+    output = [["Character", "&bsolb"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bsolhsub without a semi-colon" do
+    input = "&bsolhsub"
+    output = [["Character", "&bsolhsub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bull without a semi-colon" do
+    input = "&bull"
+    output = [["Character", "&bull"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bullet without a semi-colon" do
+    input = "&bullet"
+    output = [["Character", "&bullet"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bump without a semi-colon" do
+    input = "&bump"
+    output = [["Character", "&bump"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bumpE without a semi-colon" do
+    input = "&bumpE"
+    output = [["Character", "&bumpE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bumpe without a semi-colon" do
+    input = "&bumpe"
+    output = [["Character", "&bumpe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: bumpeq without a semi-colon" do
+    input = "&bumpeq"
+    output = [["Character", "&bumpeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cacute without a semi-colon" do
+    input = "&cacute"
+    output = [["Character", "&cacute"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cap without a semi-colon" do
+    input = "&cap"
+    output = [["Character", "&cap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: capand without a semi-colon" do
+    input = "&capand"
+    output = [["Character", "&capand"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: capbrcup without a semi-colon" do
+    input = "&capbrcup"
+    output = [["Character", "&capbrcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: capcap without a semi-colon" do
+    input = "&capcap"
+    output = [["Character", "&capcap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: capcup without a semi-colon" do
+    input = "&capcup"
+    output = [["Character", "&capcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: capdot without a semi-colon" do
+    input = "&capdot"
+    output = [["Character", "&capdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: caps without a semi-colon" do
+    input = "&caps"
+    output = [["Character", "&caps"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: caret without a semi-colon" do
+    input = "&caret"
+    output = [["Character", "&caret"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: caron without a semi-colon" do
+    input = "&caron"
+    output = [["Character", "&caron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ccaps without a semi-colon" do
+    input = "&ccaps"
+    output = [["Character", "&ccaps"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ccaron without a semi-colon" do
+    input = "&ccaron"
+    output = [["Character", "&ccaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ccirc without a semi-colon" do
+    input = "&ccirc"
+    output = [["Character", "&ccirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ccups without a semi-colon" do
+    input = "&ccups"
+    output = [["Character", "&ccups"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ccupssm without a semi-colon" do
+    input = "&ccupssm"
+    output = [["Character", "&ccupssm"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cdot without a semi-colon" do
+    input = "&cdot"
+    output = [["Character", "&cdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cemptyv without a semi-colon" do
+    input = "&cemptyv"
+    output = [["Character", "&cemptyv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cfr without a semi-colon" do
+    input = "&cfr"
+    output = [["Character", "&cfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: chcy without a semi-colon" do
+    input = "&chcy"
+    output = [["Character", "&chcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: check without a semi-colon" do
+    input = "&check"
+    output = [["Character", "&check"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: checkmark without a semi-colon" do
+    input = "&checkmark"
+    output = [["Character", "&checkmark"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: chi without a semi-colon" do
+    input = "&chi"
+    output = [["Character", "&chi"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cir without a semi-colon" do
+    input = "&cir"
+    output = [["Character", "&cir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cirE without a semi-colon" do
+    input = "&cirE"
+    output = [["Character", "&cirE"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circ without a semi-colon" do
+    input = "&circ"
+    output = [["Character", "&circ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circeq without a semi-colon" do
+    input = "&circeq"
+    output = [["Character", "&circeq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circlearrowleft without a semi-colon" do
+    input = "&circlearrowleft"
+    output = [["Character", "&circlearrowleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circlearrowright without a semi-colon" do
+    input = "&circlearrowright"
+    output = [["Character", "&circlearrowright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circledR without a semi-colon" do
+    input = "&circledR"
+    output = [["Character", "&circledR"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circledS without a semi-colon" do
+    input = "&circledS"
+    output = [["Character", "&circledS"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circledast without a semi-colon" do
+    input = "&circledast"
+    output = [["Character", "&circledast"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circledcirc without a semi-colon" do
+    input = "&circledcirc"
+    output = [["Character", "&circledcirc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: circleddash without a semi-colon" do
+    input = "&circleddash"
+    output = [["Character", "&circleddash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cire without a semi-colon" do
+    input = "&cire"
+    output = [["Character", "&cire"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cirfnint without a semi-colon" do
+    input = "&cirfnint"
+    output = [["Character", "&cirfnint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cirmid without a semi-colon" do
+    input = "&cirmid"
+    output = [["Character", "&cirmid"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cirscir without a semi-colon" do
+    input = "&cirscir"
+    output = [["Character", "&cirscir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: clubs without a semi-colon" do
+    input = "&clubs"
+    output = [["Character", "&clubs"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: clubsuit without a semi-colon" do
+    input = "&clubsuit"
+    output = [["Character", "&clubsuit"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: colon without a semi-colon" do
+    input = "&colon"
+    output = [["Character", "&colon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: colone without a semi-colon" do
+    input = "&colone"
+    output = [["Character", "&colone"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: coloneq without a semi-colon" do
+    input = "&coloneq"
+    output = [["Character", "&coloneq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: comma without a semi-colon" do
+    input = "&comma"
+    output = [["Character", "&comma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: commat without a semi-colon" do
+    input = "&commat"
+    output = [["Character", "&commat"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: comp without a semi-colon" do
+    input = "&comp"
+    output = [["Character", "&comp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: compfn without a semi-colon" do
+    input = "&compfn"
+    output = [["Character", "&compfn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: complement without a semi-colon" do
+    input = "&complement"
+    output = [["Character", "&complement"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: complexes without a semi-colon" do
+    input = "&complexes"
+    output = [["Character", "&complexes"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cong without a semi-colon" do
+    input = "&cong"
+    output = [["Character", "&cong"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: congdot without a semi-colon" do
+    input = "&congdot"
+    output = [["Character", "&congdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: conint without a semi-colon" do
+    input = "&conint"
+    output = [["Character", "&conint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: copf without a semi-colon" do
+    input = "&copf"
+    output = [["Character", "&copf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: coprod without a semi-colon" do
+    input = "&coprod"
+    output = [["Character", "&coprod"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: crarr without a semi-colon" do
+    input = "&crarr"
+    output = [["Character", "&crarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cross without a semi-colon" do
+    input = "&cross"
+    output = [["Character", "&cross"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cscr without a semi-colon" do
+    input = "&cscr"
+    output = [["Character", "&cscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: csub without a semi-colon" do
+    input = "&csub"
+    output = [["Character", "&csub"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: csube without a semi-colon" do
+    input = "&csube"
+    output = [["Character", "&csube"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: csup without a semi-colon" do
+    input = "&csup"
+    output = [["Character", "&csup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: csupe without a semi-colon" do
+    input = "&csupe"
+    output = [["Character", "&csupe"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ctdot without a semi-colon" do
+    input = "&ctdot"
+    output = [["Character", "&ctdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cudarrl without a semi-colon" do
+    input = "&cudarrl"
+    output = [["Character", "&cudarrl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cudarrr without a semi-colon" do
+    input = "&cudarrr"
+    output = [["Character", "&cudarrr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cuepr without a semi-colon" do
+    input = "&cuepr"
+    output = [["Character", "&cuepr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cuesc without a semi-colon" do
+    input = "&cuesc"
+    output = [["Character", "&cuesc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cularr without a semi-colon" do
+    input = "&cularr"
+    output = [["Character", "&cularr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cularrp without a semi-colon" do
+    input = "&cularrp"
+    output = [["Character", "&cularrp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cup without a semi-colon" do
+    input = "&cup"
+    output = [["Character", "&cup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cupbrcap without a semi-colon" do
+    input = "&cupbrcap"
+    output = [["Character", "&cupbrcap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cupcap without a semi-colon" do
+    input = "&cupcap"
+    output = [["Character", "&cupcap"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cupcup without a semi-colon" do
+    input = "&cupcup"
+    output = [["Character", "&cupcup"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cupdot without a semi-colon" do
+    input = "&cupdot"
+    output = [["Character", "&cupdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cupor without a semi-colon" do
+    input = "&cupor"
+    output = [["Character", "&cupor"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/namedEntities_part9_test.exs b/test/floki/html/generated/tokenizer/namedEntities_part9_test.exs
new file mode 100644
index 00000000..2fd60381
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/namedEntities_part9_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NamedentitiesPart9Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests namedEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Bad named entity: cups without a semi-colon" do
+    input = "&cups"
+    output = [["Character", "&cups"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curarr without a semi-colon" do
+    input = "&curarr"
+    output = [["Character", "&curarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curarrm without a semi-colon" do
+    input = "&curarrm"
+    output = [["Character", "&curarrm"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curlyeqprec without a semi-colon" do
+    input = "&curlyeqprec"
+    output = [["Character", "&curlyeqprec"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curlyeqsucc without a semi-colon" do
+    input = "&curlyeqsucc"
+    output = [["Character", "&curlyeqsucc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curlyvee without a semi-colon" do
+    input = "&curlyvee"
+    output = [["Character", "&curlyvee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curlywedge without a semi-colon" do
+    input = "&curlywedge"
+    output = [["Character", "&curlywedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curvearrowleft without a semi-colon" do
+    input = "&curvearrowleft"
+    output = [["Character", "&curvearrowleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: curvearrowright without a semi-colon" do
+    input = "&curvearrowright"
+    output = [["Character", "&curvearrowright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cuvee without a semi-colon" do
+    input = "&cuvee"
+    output = [["Character", "&cuvee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cuwed without a semi-colon" do
+    input = "&cuwed"
+    output = [["Character", "&cuwed"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cwconint without a semi-colon" do
+    input = "&cwconint"
+    output = [["Character", "&cwconint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cwint without a semi-colon" do
+    input = "&cwint"
+    output = [["Character", "&cwint"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: cylcty without a semi-colon" do
+    input = "&cylcty"
+    output = [["Character", "&cylcty"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dArr without a semi-colon" do
+    input = "&dArr"
+    output = [["Character", "&dArr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dHar without a semi-colon" do
+    input = "&dHar"
+    output = [["Character", "&dHar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dagger without a semi-colon" do
+    input = "&dagger"
+    output = [["Character", "&dagger"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: daleth without a semi-colon" do
+    input = "&daleth"
+    output = [["Character", "&daleth"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: darr without a semi-colon" do
+    input = "&darr"
+    output = [["Character", "&darr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dash without a semi-colon" do
+    input = "&dash"
+    output = [["Character", "&dash"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dashv without a semi-colon" do
+    input = "&dashv"
+    output = [["Character", "&dashv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dbkarow without a semi-colon" do
+    input = "&dbkarow"
+    output = [["Character", "&dbkarow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dblac without a semi-colon" do
+    input = "&dblac"
+    output = [["Character", "&dblac"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dcaron without a semi-colon" do
+    input = "&dcaron"
+    output = [["Character", "&dcaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dcy without a semi-colon" do
+    input = "&dcy"
+    output = [["Character", "&dcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dd without a semi-colon" do
+    input = "&dd"
+    output = [["Character", "&dd"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ddagger without a semi-colon" do
+    input = "&ddagger"
+    output = [["Character", "&ddagger"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ddarr without a semi-colon" do
+    input = "&ddarr"
+    output = [["Character", "&ddarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ddotseq without a semi-colon" do
+    input = "&ddotseq"
+    output = [["Character", "&ddotseq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: delta without a semi-colon" do
+    input = "&delta"
+    output = [["Character", "&delta"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: demptyv without a semi-colon" do
+    input = "&demptyv"
+    output = [["Character", "&demptyv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dfisht without a semi-colon" do
+    input = "&dfisht"
+    output = [["Character", "&dfisht"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dfr without a semi-colon" do
+    input = "&dfr"
+    output = [["Character", "&dfr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dharl without a semi-colon" do
+    input = "&dharl"
+    output = [["Character", "&dharl"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dharr without a semi-colon" do
+    input = "&dharr"
+    output = [["Character", "&dharr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: diam without a semi-colon" do
+    input = "&diam"
+    output = [["Character", "&diam"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: diamond without a semi-colon" do
+    input = "&diamond"
+    output = [["Character", "&diamond"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: diamondsuit without a semi-colon" do
+    input = "&diamondsuit"
+    output = [["Character", "&diamondsuit"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: diams without a semi-colon" do
+    input = "&diams"
+    output = [["Character", "&diams"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: die without a semi-colon" do
+    input = "&die"
+    output = [["Character", "&die"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: digamma without a semi-colon" do
+    input = "&digamma"
+    output = [["Character", "&digamma"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: disin without a semi-colon" do
+    input = "&disin"
+    output = [["Character", "&disin"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: div without a semi-colon" do
+    input = "&div"
+    output = [["Character", "&div"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: divonx without a semi-colon" do
+    input = "&divonx"
+    output = [["Character", "&divonx"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: djcy without a semi-colon" do
+    input = "&djcy"
+    output = [["Character", "&djcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dlcorn without a semi-colon" do
+    input = "&dlcorn"
+    output = [["Character", "&dlcorn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dlcrop without a semi-colon" do
+    input = "&dlcrop"
+    output = [["Character", "&dlcrop"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dollar without a semi-colon" do
+    input = "&dollar"
+    output = [["Character", "&dollar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dopf without a semi-colon" do
+    input = "&dopf"
+    output = [["Character", "&dopf"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dot without a semi-colon" do
+    input = "&dot"
+    output = [["Character", "&dot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: doteq without a semi-colon" do
+    input = "&doteq"
+    output = [["Character", "&doteq"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: doteqdot without a semi-colon" do
+    input = "&doteqdot"
+    output = [["Character", "&doteqdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dotminus without a semi-colon" do
+    input = "&dotminus"
+    output = [["Character", "&dotminus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dotplus without a semi-colon" do
+    input = "&dotplus"
+    output = [["Character", "&dotplus"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dotsquare without a semi-colon" do
+    input = "&dotsquare"
+    output = [["Character", "&dotsquare"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: doublebarwedge without a semi-colon" do
+    input = "&doublebarwedge"
+    output = [["Character", "&doublebarwedge"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: downarrow without a semi-colon" do
+    input = "&downarrow"
+    output = [["Character", "&downarrow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: downdownarrows without a semi-colon" do
+    input = "&downdownarrows"
+    output = [["Character", "&downdownarrows"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: downharpoonleft without a semi-colon" do
+    input = "&downharpoonleft"
+    output = [["Character", "&downharpoonleft"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: downharpoonright without a semi-colon" do
+    input = "&downharpoonright"
+    output = [["Character", "&downharpoonright"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: drbkarow without a semi-colon" do
+    input = "&drbkarow"
+    output = [["Character", "&drbkarow"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: drcorn without a semi-colon" do
+    input = "&drcorn"
+    output = [["Character", "&drcorn"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: drcrop without a semi-colon" do
+    input = "&drcrop"
+    output = [["Character", "&drcrop"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dscr without a semi-colon" do
+    input = "&dscr"
+    output = [["Character", "&dscr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dscy without a semi-colon" do
+    input = "&dscy"
+    output = [["Character", "&dscy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dsol without a semi-colon" do
+    input = "&dsol"
+    output = [["Character", "&dsol"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dstrok without a semi-colon" do
+    input = "&dstrok"
+    output = [["Character", "&dstrok"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dtdot without a semi-colon" do
+    input = "&dtdot"
+    output = [["Character", "&dtdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dtri without a semi-colon" do
+    input = "&dtri"
+    output = [["Character", "&dtri"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dtrif without a semi-colon" do
+    input = "&dtrif"
+    output = [["Character", "&dtrif"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: duarr without a semi-colon" do
+    input = "&duarr"
+    output = [["Character", "&duarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: duhar without a semi-colon" do
+    input = "&duhar"
+    output = [["Character", "&duhar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dwangle without a semi-colon" do
+    input = "&dwangle"
+    output = [["Character", "&dwangle"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dzcy without a semi-colon" do
+    input = "&dzcy"
+    output = [["Character", "&dzcy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: dzigrarr without a semi-colon" do
+    input = "&dzigrarr"
+    output = [["Character", "&dzigrarr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eDDot without a semi-colon" do
+    input = "&eDDot"
+    output = [["Character", "&eDDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eDot without a semi-colon" do
+    input = "&eDot"
+    output = [["Character", "&eDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: easter without a semi-colon" do
+    input = "&easter"
+    output = [["Character", "&easter"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ecaron without a semi-colon" do
+    input = "&ecaron"
+    output = [["Character", "&ecaron"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ecir without a semi-colon" do
+    input = "&ecir"
+    output = [["Character", "&ecir"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ecolon without a semi-colon" do
+    input = "&ecolon"
+    output = [["Character", "&ecolon"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ecy without a semi-colon" do
+    input = "&ecy"
+    output = [["Character", "&ecy"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: edot without a semi-colon" do
+    input = "&edot"
+    output = [["Character", "&edot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ee without a semi-colon" do
+    input = "&ee"
+    output = [["Character", "&ee"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: efDot without a semi-colon" do
+    input = "&efDot"
+    output = [["Character", "&efDot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: efr without a semi-colon" do
+    input = "&efr"
+    output = [["Character", "&efr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: eg without a semi-colon" do
+    input = "&eg"
+    output = [["Character", "&eg"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: egs without a semi-colon" do
+    input = "&egs"
+    output = [["Character", "&egs"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: egsdot without a semi-colon" do
+    input = "&egsdot"
+    output = [["Character", "&egsdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: el without a semi-colon" do
+    input = "&el"
+    output = [["Character", "&el"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: elinters without a semi-colon" do
+    input = "&elinters"
+    output = [["Character", "&elinters"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: ell without a semi-colon" do
+    input = "&ell"
+    output = [["Character", "&ell"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: els without a semi-colon" do
+    input = "&els"
+    output = [["Character", "&els"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: elsdot without a semi-colon" do
+    input = "&elsdot"
+    output = [["Character", "&elsdot"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: emacr without a semi-colon" do
+    input = "&emacr"
+    output = [["Character", "&emacr"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: empty without a semi-colon" do
+    input = "&empty"
+    output = [["Character", "&empty"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: emptyset without a semi-colon" do
+    input = "&emptyset"
+    output = [["Character", "&emptyset"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: emptyv without a semi-colon" do
+    input = "&emptyv"
+    output = [["Character", "&emptyv"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: emsp without a semi-colon" do
+    input = "&emsp"
+    output = [["Character", "&emsp"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Bad named entity: emsp13 without a semi-colon" do
+    input = "&emsp13"
+    output = [["Character", "&emsp13"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/numericEntities_part1_test.exs b/test/floki/html/generated/tokenizer/numericEntities_part1_test.exs
new file mode 100644
index 00000000..7590e0d2
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/numericEntities_part1_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NumericentitiesPart1Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests numericEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Invalid numeric entity character U+0000" do
+    input = "&#x0000;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0001" do
+    input = ""
+    output = [["Character", <<1>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0002" do
+    input = ""
+    output = [["Character", <<2>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0003" do
+    input = ""
+    output = [["Character", <<3>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0004" do
+    input = ""
+    output = [["Character", <<4>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0005" do
+    input = "&#x0005;"
+    output = [["Character", <<5>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0006" do
+    input = "&#x0006;"
+    output = [["Character", <<6>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0007" do
+    input = "&#x0007;"
+    output = [["Character", "\a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0008" do
+    input = "&#x0008;"
+    output = [["Character", "\b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+000B" do
+    input = "&#x000b;"
+    output = [["Character", "\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+000E" do
+    input = "&#x000e;"
+    output = [["Character", <<14>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+000F" do
+    input = "&#x000f;"
+    output = [["Character", <<15>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0010" do
+    input = "&#x0010;"
+    output = [["Character", <<16>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0011" do
+    input = "&#x0011;"
+    output = [["Character", <<17>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0012" do
+    input = "&#x0012;"
+    output = [["Character", <<18>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0013" do
+    input = "&#x0013;"
+    output = [["Character", <<19>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0014" do
+    input = "&#x0014;"
+    output = [["Character", <<20>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0015" do
+    input = "&#x0015;"
+    output = [["Character", <<21>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0016" do
+    input = "&#x0016;"
+    output = [["Character", <<22>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0017" do
+    input = "&#x0017;"
+    output = [["Character", <<23>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0018" do
+    input = "&#x0018;"
+    output = [["Character", <<24>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+0019" do
+    input = "&#x0019;"
+    output = [["Character", <<25>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+001A" do
+    input = "&#x001a;"
+    output = [["Character", <<26>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+001B" do
+    input = "&#x001b;"
+    output = [["Character", "\e"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+001C" do
+    input = "&#x001c;"
+    output = [["Character", <<28>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+001D" do
+    input = "&#x001d;"
+    output = [["Character", <<29>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+001E" do
+    input = "&#x001e;"
+    output = [["Character", <<30>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+001F" do
+    input = "&#x001f;"
+    output = [["Character", <<31>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+007F" do
+    input = "&#x007f;"
+    output = [["Character", "\d"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+10FFFE" do
+    input = "&#x10fffe;"
+    output = [["Character", "􏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+10FFFF" do
+    input = "&#x10ffff;"
+    output = [["Character", "􏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+1FFFE" do
+    input = "&#x1fffe;"
+    output = [["Character", "🿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+1FFFF" do
+    input = "&#x1ffff;"
+    output = [["Character", "🿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+2FFFE" do
+    input = "&#x2fffe;"
+    output = [["Character", "𯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+2FFFF" do
+    input = "&#x2ffff;"
+    output = [["Character", "𯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+3FFFE" do
+    input = "&#x3fffe;"
+    output = [["Character", "𿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+3FFFF" do
+    input = "&#x3ffff;"
+    output = [["Character", "𿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+4FFFE" do
+    input = "&#x4fffe;"
+    output = [["Character", "񏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+4FFFF" do
+    input = "&#x4ffff;"
+    output = [["Character", "񏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+5FFFE" do
+    input = "&#x5fffe;"
+    output = [["Character", "񟿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+5FFFF" do
+    input = "&#x5ffff;"
+    output = [["Character", "񟿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+6FFFE" do
+    input = "&#x6fffe;"
+    output = [["Character", "񯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+6FFFF" do
+    input = "&#x6ffff;"
+    output = [["Character", "񯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+7FFFE" do
+    input = "&#x7fffe;"
+    output = [["Character", "񿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+7FFFF" do
+    input = "&#x7ffff;"
+    output = [["Character", "񿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+8FFFE" do
+    input = "&#x8fffe;"
+    output = [["Character", "򏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+8FFFF" do
+    input = "&#x8ffff;"
+    output = [["Character", "򏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+9FFFE" do
+    input = "&#x9fffe;"
+    output = [["Character", "򟿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+9FFFF" do
+    input = "&#x9ffff;"
+    output = [["Character", "򟿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+AFFFE" do
+    input = "&#xafffe;"
+    output = [["Character", "򯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+AFFFF" do
+    input = "&#xaffff;"
+    output = [["Character", "򯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+BFFFE" do
+    input = "&#xbfffe;"
+    output = [["Character", "򿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+BFFFF" do
+    input = "&#xbffff;"
+    output = [["Character", "򿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+CFFFE" do
+    input = "&#xcfffe;"
+    output = [["Character", "󏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+CFFFF" do
+    input = "&#xcffff;"
+    output = [["Character", "󏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+D800" do
+    input = "&#xd800;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+DFFF" do
+    input = "&#xdfff;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+DFFFE" do
+    input = "&#xdfffe;"
+    output = [["Character", "󟿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+DFFFF" do
+    input = "&#xdffff;"
+    output = [["Character", "󟿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+EFFFE" do
+    input = "&#xefffe;"
+    output = [["Character", "󯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+EFFFF" do
+    input = "&#xeffff;"
+    output = [["Character", "󯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD0" do
+    input = "&#xfdd0;"
+    output = [["Character", "﷐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD1" do
+    input = "&#xfdd1;"
+    output = [["Character", "﷑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD2" do
+    input = "&#xfdd2;"
+    output = [["Character", "﷒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD3" do
+    input = "&#xfdd3;"
+    output = [["Character", "﷓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD4" do
+    input = "&#xfdd4;"
+    output = [["Character", "﷔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD5" do
+    input = "&#xfdd5;"
+    output = [["Character", "﷕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD6" do
+    input = "&#xfdd6;"
+    output = [["Character", "﷖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD7" do
+    input = "&#xfdd7;"
+    output = [["Character", "﷗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD8" do
+    input = "&#xfdd8;"
+    output = [["Character", "﷘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDD9" do
+    input = "&#xfdd9;"
+    output = [["Character", "﷙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDDA" do
+    input = "&#xfdda;"
+    output = [["Character", "﷚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDDB" do
+    input = "&#xfddb;"
+    output = [["Character", "﷛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDDC" do
+    input = "&#xfddc;"
+    output = [["Character", "﷜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDDD" do
+    input = "&#xfddd;"
+    output = [["Character", "﷝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDDE" do
+    input = "&#xfdde;"
+    output = [["Character", "﷞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDDF" do
+    input = "&#xfddf;"
+    output = [["Character", "﷟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE0" do
+    input = "&#xfde0;"
+    output = [["Character", "﷠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE1" do
+    input = "&#xfde1;"
+    output = [["Character", "﷡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE2" do
+    input = "&#xfde2;"
+    output = [["Character", "﷢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE3" do
+    input = "&#xfde3;"
+    output = [["Character", "﷣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE4" do
+    input = "&#xfde4;"
+    output = [["Character", "﷤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE5" do
+    input = "&#xfde5;"
+    output = [["Character", "﷥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE6" do
+    input = "&#xfde6;"
+    output = [["Character", "﷦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE7" do
+    input = "&#xfde7;"
+    output = [["Character", "﷧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE8" do
+    input = "&#xfde8;"
+    output = [["Character", "﷨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDE9" do
+    input = "&#xfde9;"
+    output = [["Character", "﷩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDEA" do
+    input = "&#xfdea;"
+    output = [["Character", "﷪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDEB" do
+    input = "&#xfdeb;"
+    output = [["Character", "﷫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDEC" do
+    input = "&#xfdec;"
+    output = [["Character", "﷬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDED" do
+    input = "&#xfded;"
+    output = [["Character", "﷭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDEE" do
+    input = "&#xfdee;"
+    output = [["Character", "﷮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FDEF" do
+    input = "&#xfdef;"
+    output = [["Character", "﷯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FFFE" do
+    input = "&#xfffe;"
+    output = [["Character", <<239, 191, 190>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FFFF" do
+    input = "&#xffff;"
+    output = [["Character", <<239, 191, 191>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FFFFE" do
+    input = "&#xffffe;"
+    output = [["Character", "󿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character U+FFFFF" do
+    input = "&#xfffff;"
+    output = [["Character", "󿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid numeric entity character overflow" do
+    input = "&#11111111111;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid unterminated numeric entity character overflow" do
+    input = "&#11111111111x"
+    output = [["Character", "�x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid unterminated numeric entity character overflow before EOF" do
+    input = "&#11111111111"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/numericEntities_part2_test.exs b/test/floki/html/generated/tokenizer/numericEntities_part2_test.exs
new file mode 100644
index 00000000..cbf5b039
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/numericEntities_part2_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NumericentitiesPart2Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests numericEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Valid numeric entity character U+0009" do
+    input = "&#x0009;"
+    output = [["Character", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+000A" do
+    input = "&#x000a;"
+    output = [["Character", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0020" do
+    input = "&#x0020;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0021" do
+    input = "&#x0021;"
+    output = [["Character", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0022" do
+    input = "&#x0022;"
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0023" do
+    input = "&#x0023;"
+    output = [["Character", "#"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0024" do
+    input = "&#x0024;"
+    output = [["Character", "$"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0025" do
+    input = "&#x0025;"
+    output = [["Character", "%"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0026" do
+    input = "&#x0026;"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0027" do
+    input = "&#x0027;"
+    output = [["Character", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0028" do
+    input = "&#x0028;"
+    output = [["Character", "("]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0029" do
+    input = "&#x0029;"
+    output = [["Character", ")"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+002A" do
+    input = "&#x002a;"
+    output = [["Character", "*"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+002B" do
+    input = "&#x002b;"
+    output = [["Character", "+"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+002C" do
+    input = "&#x002c;"
+    output = [["Character", ","]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+002D" do
+    input = "&#x002d;"
+    output = [["Character", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+002E" do
+    input = "&#x002e;"
+    output = [["Character", "."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+002F" do
+    input = "&#x002f;"
+    output = [["Character", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0030" do
+    input = "&#x0030;"
+    output = [["Character", "0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0031" do
+    input = "&#x0031;"
+    output = [["Character", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0032" do
+    input = "&#x0032;"
+    output = [["Character", "2"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0033" do
+    input = "&#x0033;"
+    output = [["Character", "3"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0034" do
+    input = "&#x0034;"
+    output = [["Character", "4"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0035" do
+    input = "&#x0035;"
+    output = [["Character", "5"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0036" do
+    input = "&#x0036;"
+    output = [["Character", "6"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0037" do
+    input = "&#x0037;"
+    output = [["Character", "7"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0038" do
+    input = "&#x0038;"
+    output = [["Character", "8"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0039" do
+    input = "&#x0039;"
+    output = [["Character", "9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+003A" do
+    input = "&#x003a;"
+    output = [["Character", ":"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+003B" do
+    input = "&#x003b;"
+    output = [["Character", ";"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+003C" do
+    input = "&#x003c;"
+    output = [["Character", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+003D" do
+    input = "&#x003d;"
+    output = [["Character", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+003E" do
+    input = "&#x003e;"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+003F" do
+    input = "&#x003f;"
+    output = [["Character", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0040" do
+    input = "&#x0040;"
+    output = [["Character", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0041" do
+    input = "&#x0041;"
+    output = [["Character", "A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0042" do
+    input = "&#x0042;"
+    output = [["Character", "B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0043" do
+    input = "&#x0043;"
+    output = [["Character", "C"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0044" do
+    input = "&#x0044;"
+    output = [["Character", "D"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0045" do
+    input = "&#x0045;"
+    output = [["Character", "E"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0046" do
+    input = "&#x0046;"
+    output = [["Character", "F"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0047" do
+    input = "&#x0047;"
+    output = [["Character", "G"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0048" do
+    input = "&#x0048;"
+    output = [["Character", "H"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0049" do
+    input = "&#x0049;"
+    output = [["Character", "I"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+004A" do
+    input = "&#x004a;"
+    output = [["Character", "J"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+004B" do
+    input = "&#x004b;"
+    output = [["Character", "K"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+004C" do
+    input = "&#x004c;"
+    output = [["Character", "L"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+004D" do
+    input = "&#x004d;"
+    output = [["Character", "M"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+004E" do
+    input = "&#x004e;"
+    output = [["Character", "N"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+004F" do
+    input = "&#x004f;"
+    output = [["Character", "O"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0050" do
+    input = "&#x0050;"
+    output = [["Character", "P"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0051" do
+    input = "&#x0051;"
+    output = [["Character", "Q"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0052" do
+    input = "&#x0052;"
+    output = [["Character", "R"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0053" do
+    input = "&#x0053;"
+    output = [["Character", "S"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0054" do
+    input = "&#x0054;"
+    output = [["Character", "T"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0055" do
+    input = "&#x0055;"
+    output = [["Character", "U"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0056" do
+    input = "&#x0056;"
+    output = [["Character", "V"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0057" do
+    input = "&#x0057;"
+    output = [["Character", "W"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0058" do
+    input = "&#x0058;"
+    output = [["Character", "X"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0059" do
+    input = "&#x0059;"
+    output = [["Character", "Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+005A" do
+    input = "&#x005a;"
+    output = [["Character", "Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+005B" do
+    input = "&#x005b;"
+    output = [["Character", "["]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+005C" do
+    input = "&#x005c;"
+    output = [["Character", "\\"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+005D" do
+    input = "&#x005d;"
+    output = [["Character", "]"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+005E" do
+    input = "&#x005e;"
+    output = [["Character", "^"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+005F" do
+    input = "&#x005f;"
+    output = [["Character", "_"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0060" do
+    input = "&#x0060;"
+    output = [["Character", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0061" do
+    input = "&#x0061;"
+    output = [["Character", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0062" do
+    input = "&#x0062;"
+    output = [["Character", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0063" do
+    input = "&#x0063;"
+    output = [["Character", "c"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0064" do
+    input = "&#x0064;"
+    output = [["Character", "d"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0065" do
+    input = "&#x0065;"
+    output = [["Character", "e"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0066" do
+    input = "&#x0066;"
+    output = [["Character", "f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0067" do
+    input = "&#x0067;"
+    output = [["Character", "g"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0068" do
+    input = "&#x0068;"
+    output = [["Character", "h"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0069" do
+    input = "&#x0069;"
+    output = [["Character", "i"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+006A" do
+    input = "&#x006a;"
+    output = [["Character", "j"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+006B" do
+    input = "&#x006b;"
+    output = [["Character", "k"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+006C" do
+    input = "&#x006c;"
+    output = [["Character", "l"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+006D" do
+    input = "&#x006d;"
+    output = [["Character", "m"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+006E" do
+    input = "&#x006e;"
+    output = [["Character", "n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+006F" do
+    input = "&#x006f;"
+    output = [["Character", "o"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0070" do
+    input = "&#x0070;"
+    output = [["Character", "p"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0071" do
+    input = "&#x0071;"
+    output = [["Character", "q"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0072" do
+    input = "&#x0072;"
+    output = [["Character", "r"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0073" do
+    input = "&#x0073;"
+    output = [["Character", "s"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0074" do
+    input = "&#x0074;"
+    output = [["Character", "t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0075" do
+    input = "&#x0075;"
+    output = [["Character", "u"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0076" do
+    input = "&#x0076;"
+    output = [["Character", "v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0077" do
+    input = "&#x0077;"
+    output = [["Character", "w"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0078" do
+    input = "&#x0078;"
+    output = [["Character", "x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+0079" do
+    input = "&#x0079;"
+    output = [["Character", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+007A" do
+    input = "&#x007a;"
+    output = [["Character", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+007B" do
+    input = "&#x007b;"
+    output = [["Character", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+007C" do
+    input = "&#x007c;"
+    output = [["Character", "|"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+007D" do
+    input = "&#x007d;"
+    output = [["Character", "}"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+007E" do
+    input = "&#x007e;"
+    output = [["Character", "~"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A0" do
+    input = "&#x00a0;"
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A1" do
+    input = "&#x00a1;"
+    output = [["Character", "¡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A2" do
+    input = "&#x00a2;"
+    output = [["Character", "¢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/numericEntities_part3_test.exs b/test/floki/html/generated/tokenizer/numericEntities_part3_test.exs
new file mode 100644
index 00000000..2a89fb20
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/numericEntities_part3_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.NumericentitiesPart3Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests numericEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Valid numeric entity character U+00A3" do
+    input = "&#x00a3;"
+    output = [["Character", "£"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A4" do
+    input = "&#x00a4;"
+    output = [["Character", "¤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A5" do
+    input = "&#x00a5;"
+    output = [["Character", "¥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A6" do
+    input = "&#x00a6;"
+    output = [["Character", "¦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A7" do
+    input = "&#x00a7;"
+    output = [["Character", "§"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A8" do
+    input = "&#x00a8;"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00A9" do
+    input = "&#x00a9;"
+    output = [["Character", "©"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00AA" do
+    input = "&#x00aa;"
+    output = [["Character", "ª"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00AB" do
+    input = "&#x00ab;"
+    output = [["Character", "«"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00AC" do
+    input = "&#x00ac;"
+    output = [["Character", "¬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00AD" do
+    input = "&#x00ad;"
+    output = [["Character", "­"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00AE" do
+    input = "&#x00ae;"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00AF" do
+    input = "&#x00af;"
+    output = [["Character", "¯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B0" do
+    input = "&#x00b0;"
+    output = [["Character", "°"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B1" do
+    input = "&#x00b1;"
+    output = [["Character", "±"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B2" do
+    input = "&#x00b2;"
+    output = [["Character", "²"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B3" do
+    input = "&#x00b3;"
+    output = [["Character", "³"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B4" do
+    input = "&#x00b4;"
+    output = [["Character", "´"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B5" do
+    input = "&#x00b5;"
+    output = [["Character", "µ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B6" do
+    input = "&#x00b6;"
+    output = [["Character", "¶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B7" do
+    input = "&#x00b7;"
+    output = [["Character", "·"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B8" do
+    input = "&#x00b8;"
+    output = [["Character", "¸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00B9" do
+    input = "&#x00b9;"
+    output = [["Character", "¹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00BA" do
+    input = "&#x00ba;"
+    output = [["Character", "º"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00BB" do
+    input = "&#x00bb;"
+    output = [["Character", "»"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00BC" do
+    input = "&#x00bc;"
+    output = [["Character", "¼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00BD" do
+    input = "&#x00bd;"
+    output = [["Character", "½"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00BE" do
+    input = "&#x00be;"
+    output = [["Character", "¾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00BF" do
+    input = "&#x00bf;"
+    output = [["Character", "¿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C0" do
+    input = "&#x00c0;"
+    output = [["Character", "À"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C1" do
+    input = "&#x00c1;"
+    output = [["Character", "Á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C2" do
+    input = "&#x00c2;"
+    output = [["Character", "Â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C3" do
+    input = "&#x00c3;"
+    output = [["Character", "Ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C4" do
+    input = "&#x00c4;"
+    output = [["Character", "Ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C5" do
+    input = "&#x00c5;"
+    output = [["Character", "Å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C6" do
+    input = "&#x00c6;"
+    output = [["Character", "Æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C7" do
+    input = "&#x00c7;"
+    output = [["Character", "Ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C8" do
+    input = "&#x00c8;"
+    output = [["Character", "È"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00C9" do
+    input = "&#x00c9;"
+    output = [["Character", "É"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00CA" do
+    input = "&#x00ca;"
+    output = [["Character", "Ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00CB" do
+    input = "&#x00cb;"
+    output = [["Character", "Ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00CC" do
+    input = "&#x00cc;"
+    output = [["Character", "Ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00CD" do
+    input = "&#x00cd;"
+    output = [["Character", "Í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00CE" do
+    input = "&#x00ce;"
+    output = [["Character", "Î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00CF" do
+    input = "&#x00cf;"
+    output = [["Character", "Ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D0" do
+    input = "&#x00d0;"
+    output = [["Character", "Ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D1" do
+    input = "&#x00d1;"
+    output = [["Character", "Ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D2" do
+    input = "&#x00d2;"
+    output = [["Character", "Ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D3" do
+    input = "&#x00d3;"
+    output = [["Character", "Ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D4" do
+    input = "&#x00d4;"
+    output = [["Character", "Ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D5" do
+    input = "&#x00d5;"
+    output = [["Character", "Õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D6" do
+    input = "&#x00d6;"
+    output = [["Character", "Ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D7" do
+    input = "&#x00d7;"
+    output = [["Character", "×"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D8" do
+    input = "&#x00d8;"
+    output = [["Character", "Ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00D9" do
+    input = "&#x00d9;"
+    output = [["Character", "Ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00DA" do
+    input = "&#x00da;"
+    output = [["Character", "Ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00DB" do
+    input = "&#x00db;"
+    output = [["Character", "Û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00DC" do
+    input = "&#x00dc;"
+    output = [["Character", "Ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00DD" do
+    input = "&#x00dd;"
+    output = [["Character", "Ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00DE" do
+    input = "&#x00de;"
+    output = [["Character", "Þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00DF" do
+    input = "&#x00df;"
+    output = [["Character", "ß"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E0" do
+    input = "&#x00e0;"
+    output = [["Character", "à"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E1" do
+    input = "&#x00e1;"
+    output = [["Character", "á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E2" do
+    input = "&#x00e2;"
+    output = [["Character", "â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E3" do
+    input = "&#x00e3;"
+    output = [["Character", "ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E4" do
+    input = "&#x00e4;"
+    output = [["Character", "ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E5" do
+    input = "&#x00e5;"
+    output = [["Character", "å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E6" do
+    input = "&#x00e6;"
+    output = [["Character", "æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E7" do
+    input = "&#x00e7;"
+    output = [["Character", "ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E8" do
+    input = "&#x00e8;"
+    output = [["Character", "è"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00E9" do
+    input = "&#x00e9;"
+    output = [["Character", "é"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00EA" do
+    input = "&#x00ea;"
+    output = [["Character", "ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00EB" do
+    input = "&#x00eb;"
+    output = [["Character", "ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00EC" do
+    input = "&#x00ec;"
+    output = [["Character", "ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00ED" do
+    input = "&#x00ed;"
+    output = [["Character", "í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00EE" do
+    input = "&#x00ee;"
+    output = [["Character", "î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00EF" do
+    input = "&#x00ef;"
+    output = [["Character", "ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F0" do
+    input = "&#x00f0;"
+    output = [["Character", "ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F1" do
+    input = "&#x00f1;"
+    output = [["Character", "ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F2" do
+    input = "&#x00f2;"
+    output = [["Character", "ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F3" do
+    input = "&#x00f3;"
+    output = [["Character", "ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F4" do
+    input = "&#x00f4;"
+    output = [["Character", "ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F5" do
+    input = "&#x00f5;"
+    output = [["Character", "õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F6" do
+    input = "&#x00f6;"
+    output = [["Character", "ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F7" do
+    input = "&#x00f7;"
+    output = [["Character", "÷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F8" do
+    input = "&#x00f8;"
+    output = [["Character", "ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00F9" do
+    input = "&#x00f9;"
+    output = [["Character", "ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00FA" do
+    input = "&#x00fa;"
+    output = [["Character", "ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00FB" do
+    input = "&#x00fb;"
+    output = [["Character", "û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00FC" do
+    input = "&#x00fc;"
+    output = [["Character", "ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00FD" do
+    input = "&#x00fd;"
+    output = [["Character", "ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00FE" do
+    input = "&#x00fe;"
+    output = [["Character", "þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+00FF" do
+    input = "&#x00ff;"
+    output = [["Character", "ÿ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+10000" do
+    input = "&#x10000;"
+    output = [["Character", "𐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+100000" do
+    input = "&#x100000;"
+    output = [["Character", "􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+10FFFD" do
+    input = "&#x10fffd;"
+    output = [["Character", "􏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+1FFFD" do
+    input = "&#x1fffd;"
+    output = [["Character", "🿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+20000" do
+    input = "&#x20000;"
+    output = [["Character", "𠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+2FFFD" do
+    input = "&#x2fffd;"
+    output = [["Character", "𯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+30000" do
+    input = "&#x30000;"
+    output = [["Character", "𰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/numericEntities_part4_test.exs b/test/floki/html/generated/tokenizer/numericEntities_part4_test.exs
new file mode 100644
index 00000000..c7d5db65
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/numericEntities_part4_test.exs
@@ -0,0 +1,368 @@
+defmodule Floki.HTML.Generated.Tokenizer.NumericentitiesPart4Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests numericEntities.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Valid numeric entity character U+3FFFD" do
+    input = "&#x3fffd;"
+    output = [["Character", "𿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+40000" do
+    input = "&#x40000;"
+    output = [["Character", "񀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+4FFFD" do
+    input = "&#x4fffd;"
+    output = [["Character", "񏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+50000" do
+    input = "&#x50000;"
+    output = [["Character", "񐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+5FFFD" do
+    input = "&#x5fffd;"
+    output = [["Character", "񟿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+60000" do
+    input = "&#x60000;"
+    output = [["Character", "񠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+6FFFD" do
+    input = "&#x6fffd;"
+    output = [["Character", "񯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+70000" do
+    input = "&#x70000;"
+    output = [["Character", "񰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+7FFFD" do
+    input = "&#x7fffd;"
+    output = [["Character", "񿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+80000" do
+    input = "&#x80000;"
+    output = [["Character", "򀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+8FFFD" do
+    input = "&#x8fffd;"
+    output = [["Character", "򏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+90000" do
+    input = "&#x90000;"
+    output = [["Character", "򐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+9FFFD" do
+    input = "&#x9fffd;"
+    output = [["Character", "򟿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+A0000" do
+    input = "&#xa0000;"
+    output = [["Character", "򠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+AFFFD" do
+    input = "&#xafffd;"
+    output = [["Character", "򯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+B0000" do
+    input = "&#xb0000;"
+    output = [["Character", "򰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+BFFFD" do
+    input = "&#xbfffd;"
+    output = [["Character", "򿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+C0000" do
+    input = "&#xc0000;"
+    output = [["Character", "󀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+CFFFD" do
+    input = "&#xcfffd;"
+    output = [["Character", "󏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+D0000" do
+    input = "&#xd0000;"
+    output = [["Character", "󐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+D7FF" do
+    input = "&#xd7ff;"
+    output = [["Character", "퟿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+DFFFD" do
+    input = "&#xdfffd;"
+    output = [["Character", "󟿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+E000" do
+    input = "&#xe000;"
+    output = [["Character", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+E0000" do
+    input = "&#xe0000;"
+    output = [["Character", "󠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+EFFFD" do
+    input = "&#xefffd;"
+    output = [["Character", "󯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+F0000" do
+    input = "&#xf0000;"
+    output = [["Character", "󰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+FDCF" do
+    input = "&#xfdcf;"
+    output = [["Character", "﷏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+FDF0" do
+    input = "&#xfdf0;"
+    output = [["Character", "ﷰ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+FFFD" do
+    input = "&#xfffd;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid numeric entity character U+FFFFD" do
+    input = "&#xffffd;"
+    output = [["Character", "󿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test1_test.exs b/test/floki/html/generated/tokenizer/test1_test.exs
new file mode 100644
index 00000000..c08e6e8b
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test1_test.exs
@@ -0,0 +1,602 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test1Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test1.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 ASCII decimal entity" do
+    input = "&#0036;"
+    output = [["Character", "$"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 ASCII hexadecimal entity" do
+    input = "&#x3f;"
+    output = [["Character", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Ampersand EOF" do
+    input = "&"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Ampersand ampersand EOF" do
+    input = "&&"
+    output = [["Character", "&&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Ampersand space EOF" do
+    input = "& "
+    output = [["Character", "& "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Ampersand, number sign" do
+    input = "&#"
+    output = [["Character", "&#"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Comment, Central dash no space" do
+    input = "<!----->"
+    output = [["Comment", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Comment, two central dashes" do
+    input = "<!-- --comment -->"
+    output = [["Comment", " --comment "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Correct Doctype case with EOF" do
+    input = "<!DOCTYPE HtMl"
+    output = [["DOCTYPE", "html", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Correct Doctype lowercase" do
+    input = "<!DOCTYPE html>"
+    output = [["DOCTYPE", "html", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Correct Doctype mixed case" do
+    input = "<!DOCTYPE HtMl>"
+    output = [["DOCTYPE", "html", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Correct Doctype uppercase" do
+    input = "<!DOCTYPE HTML>"
+    output = [["DOCTYPE", "html", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Doctype in error" do
+    input = "<!DOCTYPE foo>"
+    output = [["DOCTYPE", "foo", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty end tag" do
+    input = "</>"
+    output = []
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty start tag" do
+    input = "<>"
+    output = [["Character", "<>"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 End Tag w/attribute" do
+    input = "<h></h a='b'>"
+    output = [["StartTag", "h", %{}], ["EndTag", "h"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity in attribute without semicolon" do
+    input = "<h a='&COPY'>"
+    output = [["StartTag", "h", %{"a" => "©"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity in attribute without semicolon ending in 1" do
+    input = "<h a='&not1'>"
+    output = [["StartTag", "h", %{"a" => "&not1"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity in attribute without semicolon ending in i" do
+    input = "<h a='&noti'>"
+    output = [["StartTag", "h", %{"a" => "&noti"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity in attribute without semicolon ending in x" do
+    input = "<h a='&notx'>"
+    output = [["StartTag", "h", %{"a" => "&notx"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity with trailing semicolon (1)" do
+    input = "I'm &not;it"
+    output = [["Character", "I'm ¬it"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity with trailing semicolon (2)" do
+    input = "I'm &notin;"
+    output = [["Character", "I'm ∉"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity without trailing semicolon (1)" do
+    input = "I'm &notit"
+    output = [["Character", "I'm ¬it"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity without trailing semicolon (2)" do
+    input = "I'm &notin"
+    output = [["Character", "I'm ¬in"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Hexadecimal entity in attribute" do
+    input = "<h a='&#x3f;'></h>"
+    output = [["StartTag", "h", %{"a" => "?"}], ["EndTag", "h"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Multiple atts" do
+    input = "<h a='b' c='d'>"
+    output = [["StartTag", "h", %{"a" => "b", "c" => "d"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Multiple atts no space" do
+    input = "<h a='b'c='d'>"
+    output = [["StartTag", "h", %{"a" => "b", "c" => "d"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Nested comment" do
+    input = "<!-- <!--test-->"
+    output = [["Comment", " <!--test"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Non-ASCII character reference name" do
+    input = "&¬;"
+    output = [["Character", "&¬;"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Open angled bracket in unquoted attribute value state" do
+    input = "<a a=f<>"
+    output = [["StartTag", "a", %{"a" => "f<"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Partial entity match at end of file" do
+    input = "I'm &no"
+    output = [["Character", "I'm &no"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Repeated attr" do
+    input = "<h a='b' a='d'>"
+    output = [["StartTag", "h", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Short comment" do
+    input = "<!-->"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Short comment three" do
+    input = "<!---->"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Short comment two" do
+    input = "<!--->"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Simple comment" do
+    input = "<!--comment-->"
+    output = [["Comment", "comment"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Single Start Tag" do
+    input = "<h>"
+    output = [["StartTag", "h", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Start Tag w/attribute" do
+    input = "<h a='b'>"
+    output = [["StartTag", "h", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Start Tag w/attribute no quotes" do
+    input = "<h a=b>"
+    output = [["StartTag", "h", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Start of a comment" do
+    input = "<!-"
+    output = [["Comment", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Start/End Tag" do
+    input = "<h></h>"
+    output = [["StartTag", "h", %{}], ["EndTag", "h"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Truncated doctype start" do
+    input = "<!DOC>"
+    output = [["Comment", "DOC"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Two unclosed start tags" do
+    input = "<p>One<p>Two"
+
+    output = [
+      ["StartTag", "p", %{}],
+      ["Character", "One"],
+      ["StartTag", "p", %{}],
+      ["Character", "Two"]
+    ]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unfinished comment" do
+    input = "<!--comment"
+    output = [["Comment", "comment"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unfinished entity" do
+    input = "&f"
+    output = [["Character", "&f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unfinished numeric entity" do
+    input = "&#x"
+    output = [["Character", "&#x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unquoted attribute at end of tag with final character of &, with tag followed by characters" do
+    input = "<a a=a&>foo"
+    output = [["StartTag", "a", %{"a" => "a&"}], ["Character", "foo"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unquoted attribute ending in ampersand" do
+    input = "<s o=& t>"
+    output = [["StartTag", "s", %{"o" => "&", "t" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 plaintext element" do
+    input = "<plaintext>foobar"
+    output = [["StartTag", "plaintext", %{}], ["Character", "foobar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test2_test.exs b/test/floki/html/generated/tokenizer/test2_test.exs
new file mode 100644
index 00000000..e1cd505d
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test2_test.exs
@@ -0,0 +1,546 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test2Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test2.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 A bogus comment stops at >, even if preceeded by two dashes" do
+    input = "<?foo-->"
+    output = [["Comment", "?foo--"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Comment with dash" do
+    input = "<!---x"
+    output = [["Comment", "-x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with > in double-quoted publicId" do
+    input = "<!DOCTYPE html PUBLIC \">x"
+    output = [["DOCTYPE", "html", "", nil, false], ["Character", "x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with > in double-quoted systemId" do
+    input = "<!DOCTYPE html PUBLIC \"foo\" \">x"
+    output = [["DOCTYPE", "html", "foo", "", false], ["Character", "x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with > in single-quoted publicId" do
+    input = "<!DOCTYPE html PUBLIC '>x"
+    output = [["DOCTYPE", "html", "", nil, false], ["Character", "x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with > in single-quoted systemId" do
+    input = "<!DOCTYPE html PUBLIC 'foo' '>x"
+    output = [["DOCTYPE", "html", "foo", "", false], ["Character", "x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with EOF after PUBLIC" do
+    input = "<!DOCTYPE html PUBLIC"
+    output = [["DOCTYPE", "html", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with EOF after PUBLIC '" do
+    input = "<!DOCTYPE html PUBLIC '"
+    output = [["DOCTYPE", "html", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with EOF after PUBLIC 'x" do
+    input = "<!DOCTYPE html PUBLIC 'x"
+    output = [["DOCTYPE", "html", "x", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with publicId" do
+    input = "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML Transitional 4.01//EN\">"
+    output = [["DOCTYPE", "html", "-//W3C//DTD HTML Transitional 4.01//EN", nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with publicId and systemId" do
+    input =
+      "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML Transitional 4.01//EN\" \"-//W3C//DTD HTML Transitional 4.01//EN\">"
+
+    output = [
+      [
+        "DOCTYPE",
+        "html",
+        "-//W3C//DTD HTML Transitional 4.01//EN",
+        "-//W3C//DTD HTML Transitional 4.01//EN",
+        true
+      ]
+    ]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE with systemId" do
+    input = "<!DOCTYPE html SYSTEM \"-//W3C//DTD HTML Transitional 4.01//EN\">"
+    output = [["DOCTYPE", "html", nil, "-//W3C//DTD HTML Transitional 4.01//EN", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE without name" do
+    input = "<!DOCTYPE>"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 DOCTYPE without space before name" do
+    input = "<!DOCTYPEhtml>"
+    output = [["DOCTYPE", "html", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Double-quote after attribute name" do
+    input = "<h a \">"
+    output = [["StartTag", "h", %{"\"" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Double-quoted attribute value" do
+    input = "<h a=\"b\">"
+    output = [["StartTag", "h", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty attribute followed by uppercase attribute" do
+    input = "<h a B=''>"
+    output = [["StartTag", "h", %{"a" => "", "b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty end tag with following characters" do
+    input = "a</>bc"
+    output = [["Character", "abc"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty end tag with following comment" do
+    input = "a</><!--b-->c"
+    output = [["Character", "a"], ["Comment", "b"], ["Character", "c"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty end tag with following end tag" do
+    input = "a</></b>c"
+    output = [["Character", "a"], ["EndTag", "b"], ["Character", "c"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Empty end tag with following tag" do
+    input = "a</><b>c"
+    output = [["Character", "a"], ["StartTag", "b", %{}], ["Character", "c"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity + newline" do
+    input = "\nx\n&gt;\n"
+    output = [["Character", "\nx\n>\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Entity without a name" do
+    input = "&;"
+    output = [["Character", "&;"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Hexadecimal entity pair representing a surrogate pair" do
+    input = "&#xD869;&#xDED6;"
+    output = [["Character", "��"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Hexadecimal entity representing a codepoint after 1114111 (U+10FFFF)" do
+    input = "&#x1010FFFF;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Hexadecimal entity representing the NUL character" do
+    input = "&#x0000;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Hexadecimal entity with mixed uppercase and lowercase" do
+    input = "&#xaBcD;"
+    output = [["Character", "ꯍ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Illegal end tag name" do
+    input = "</1>"
+    output = [["Comment", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Incomplete doctype" do
+    input = "<!DOCTYPE html "
+    output = [["DOCTYPE", "html", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Incorrect DOCTYPE without a space before name" do
+    input = "<!DOCTYPEfoo>"
+    output = [["DOCTYPE", "foo", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Non-void element containing trailing /" do
+    input = "<h/>"
+    output = [["StartTag", "h", %{}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Null Byte Replacement" do
+    input = <<0>>
+    output = [["Character", <<0>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Numeric entity representing a codepoint after 1114111 (U+10FFFF)" do
+    input = "&#2225222;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Numeric entity representing the NUL character" do
+    input = "&#0000;"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Simili processing instruction" do
+    input = "<?namespace>"
+    output = [["Comment", "?namespace"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Single-quote after attribute name" do
+    input = "<h a '>"
+    output = [["StartTag", "h", %{"'" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Start tag with no attributes but space before the greater-than sign" do
+    input = "<h >"
+    output = [["StartTag", "h", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 StartTag containing /" do
+    input = "<h/a='b'>"
+    output = [["StartTag", "h", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 StartTag containing <" do
+    input = "<a<b>"
+    output = [["StartTag", "a<b", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unescaped <" do
+    input = "foo < bar"
+    output = [["Character", "foo < bar"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unescaped </" do
+    input = "</"
+    output = [["Character", "</"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Unescaped ampersand in attribute value" do
+    input = "<h a='&'>"
+    output = [["StartTag", "h", %{"a" => "&"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Void element with permitted slash" do
+    input = "<br/>"
+    output = [["StartTag", "br", %{}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Void element with permitted slash (with attribute)" do
+    input = "<br foo='bar'/>"
+    output = [["StartTag", "br", %{"foo" => "bar"}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part10_test.exs b/test/floki/html/generated/tokenizer/test3_part10_test.exs
new file mode 100644
index 00000000..3fa76d0d
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part10_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part10Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'0" do
+    input = "<!DOCTYPEa SYSTEM'0"
+    output = [["DOCTYPE", "a", nil, "0", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'1" do
+    input = "<!DOCTYPEa SYSTEM'1"
+    output = [["DOCTYPE", "a", nil, "1", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'9" do
+    input = "<!DOCTYPEa SYSTEM'9"
+    output = [["DOCTYPE", "a", nil, "9", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'<" do
+    input = "<!DOCTYPEa SYSTEM'<"
+    output = [["DOCTYPE", "a", nil, "<", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'=" do
+    input = "<!DOCTYPEa SYSTEM'="
+    output = [["DOCTYPE", "a", nil, "=", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'>" do
+    input = "<!DOCTYPEa SYSTEM'>"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'?" do
+    input = "<!DOCTYPEa SYSTEM'?"
+    output = [["DOCTYPE", "a", nil, "?", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'@" do
+    input = "<!DOCTYPEa SYSTEM'@"
+    output = [["DOCTYPE", "a", nil, "@", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'A" do
+    input = "<!DOCTYPEa SYSTEM'A"
+    output = [["DOCTYPE", "a", nil, "A", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'B" do
+    input = "<!DOCTYPEa SYSTEM'B"
+    output = [["DOCTYPE", "a", nil, "B", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'Y" do
+    input = "<!DOCTYPEa SYSTEM'Y"
+    output = [["DOCTYPE", "a", nil, "Y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'Z" do
+    input = "<!DOCTYPEa SYSTEM'Z"
+    output = [["DOCTYPE", "a", nil, "Z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 83, 89, 83, 84, 69, 77, 39, 0>>
+    output = [["DOCTYPE", "a", nil, "�", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\\u0009" do
+    input = "<!DOCTYPEa SYSTEM'\t"
+    output = [["DOCTYPE", "a", nil, "\t", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\\u000A" do
+    input = "<!DOCTYPEa SYSTEM'\n"
+    output = [["DOCTYPE", "a", nil, "\n", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\\u000B" do
+    input = "<!DOCTYPEa SYSTEM'\v"
+    output = [["DOCTYPE", "a", nil, "\v", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\\u000C" do
+    input = "<!DOCTYPEa SYSTEM'\f"
+    output = [["DOCTYPE", "a", nil, "\f", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa SYSTEM'􀀀"
+    output = [["DOCTYPE", "a", nil, "􀀀", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'`" do
+    input = "<!DOCTYPEa SYSTEM'`"
+    output = [["DOCTYPE", "a", nil, "`", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'a" do
+    input = "<!DOCTYPEa SYSTEM'a"
+    output = [["DOCTYPE", "a", nil, "a", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'b" do
+    input = "<!DOCTYPEa SYSTEM'b"
+    output = [["DOCTYPE", "a", nil, "b", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'y" do
+    input = "<!DOCTYPEa SYSTEM'y"
+    output = [["DOCTYPE", "a", nil, "y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'z" do
+    input = "<!DOCTYPEa SYSTEM'z"
+    output = [["DOCTYPE", "a", nil, "z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'{" do
+    input = "<!DOCTYPEa SYSTEM'{"
+    output = [["DOCTYPE", "a", nil, "{", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM(" do
+    input = "<!DOCTYPEa SYSTEM("
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM-" do
+    input = "<!DOCTYPEa SYSTEM-"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM/" do
+    input = "<!DOCTYPEa SYSTEM/"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM0" do
+    input = "<!DOCTYPEa SYSTEM0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM1" do
+    input = "<!DOCTYPEa SYSTEM1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM9" do
+    input = "<!DOCTYPEa SYSTEM9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM<" do
+    input = "<!DOCTYPEa SYSTEM<"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM=" do
+    input = "<!DOCTYPEa SYSTEM="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM>" do
+    input = "<!DOCTYPEa SYSTEM>"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM?" do
+    input = "<!DOCTYPEa SYSTEM?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM@" do
+    input = "<!DOCTYPEa SYSTEM@"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMA" do
+    input = "<!DOCTYPEa SYSTEMA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMB" do
+    input = "<!DOCTYPEa SYSTEMB"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMY" do
+    input = "<!DOCTYPEa SYSTEMY"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMZ" do
+    input = "<!DOCTYPEa SYSTEMZ"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 83, 89, 83, 84, 69, 77, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u0008" do
+    input = "<!DOCTYPEa SYSTEM\b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u0009" do
+    input = "<!DOCTYPEa SYSTEM\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u000A" do
+    input = "<!DOCTYPEa SYSTEM\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u000B" do
+    input = "<!DOCTYPEa SYSTEM\v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u000C" do
+    input = "<!DOCTYPEa SYSTEM\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u000D" do
+    input = "<!DOCTYPEa SYSTEM\r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 83, 89, 83, 84, 69, 77, 31>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa SYSTEM􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM`" do
+    input = "<!DOCTYPEa SYSTEM`"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMa" do
+    input = "<!DOCTYPEa SYSTEMa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMb" do
+    input = "<!DOCTYPEa SYSTEMb"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMy" do
+    input = "<!DOCTYPEa SYSTEMy"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEMz" do
+    input = "<!DOCTYPEa SYSTEMz"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM{" do
+    input = "<!DOCTYPEa SYSTEM{"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa Y" do
+    input = "<!DOCTYPEa Y"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa Z" do
+    input = "<!DOCTYPEa Z"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u0008" do
+    input = "<!DOCTYPEa \b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u0009" do
+    input = "<!DOCTYPEa \t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u000A" do
+    input = "<!DOCTYPEa \n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u000B" do
+    input = "<!DOCTYPEa \v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u000C" do
+    input = "<!DOCTYPEa \f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u000D" do
+    input = "<!DOCTYPEa \r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 31>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa 􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa `" do
+    input = "<!DOCTYPEa `"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a" do
+    input = "<!DOCTYPEa a"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a " do
+    input = "<!DOCTYPEa a "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a!" do
+    input = "<!DOCTYPEa a!"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\"" do
+    input = "<!DOCTYPEa a\""
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a&" do
+    input = "<!DOCTYPEa a&"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a'" do
+    input = "<!DOCTYPEa a'"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a-" do
+    input = "<!DOCTYPEa a-"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a/" do
+    input = "<!DOCTYPEa a/"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a0" do
+    input = "<!DOCTYPEa a0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a1" do
+    input = "<!DOCTYPEa a1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a9" do
+    input = "<!DOCTYPEa a9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a<" do
+    input = "<!DOCTYPEa a<"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a=" do
+    input = "<!DOCTYPEa a="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a>" do
+    input = "<!DOCTYPEa a>"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a?" do
+    input = "<!DOCTYPEa a?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a@" do
+    input = "<!DOCTYPEa a@"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa aA" do
+    input = "<!DOCTYPEa aA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa aB" do
+    input = "<!DOCTYPEa aB"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa aY" do
+    input = "<!DOCTYPEa aY"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa aZ" do
+    input = "<!DOCTYPEa aZ"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 97, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\\u0009" do
+    input = "<!DOCTYPEa a\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\\u000A" do
+    input = "<!DOCTYPEa a\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\\u000B" do
+    input = "<!DOCTYPEa a\v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\\u000C" do
+    input = "<!DOCTYPEa a\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa a􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a`" do
+    input = "<!DOCTYPEa a`"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa aa" do
+    input = "<!DOCTYPEa aa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa ab" do
+    input = "<!DOCTYPEa ab"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa ay" do
+    input = "<!DOCTYPEa ay"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa az" do
+    input = "<!DOCTYPEa az"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa a{" do
+    input = "<!DOCTYPEa a{"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa b" do
+    input = "<!DOCTYPEa b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa y" do
+    input = "<!DOCTYPEa y"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part11_test.exs b/test/floki/html/generated/tokenizer/test3_part11_test.exs
new file mode 100644
index 00000000..7ec4b8b4
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part11_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part11Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPEa z" do
+    input = "<!DOCTYPEa z"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa {" do
+    input = "<!DOCTYPEa {"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa!" do
+    input = "<!DOCTYPEa!"
+    output = [["DOCTYPE", "a!", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\"" do
+    input = "<!DOCTYPEa\""
+    output = [["DOCTYPE", "a\"", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa&" do
+    input = "<!DOCTYPEa&"
+    output = [["DOCTYPE", "a&", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa'" do
+    input = "<!DOCTYPEa'"
+    output = [["DOCTYPE", "a'", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa-" do
+    input = "<!DOCTYPEa-"
+    output = [["DOCTYPE", "a-", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa/" do
+    input = "<!DOCTYPEa/"
+    output = [["DOCTYPE", "a/", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa0" do
+    input = "<!DOCTYPEa0"
+    output = [["DOCTYPE", "a0", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa1" do
+    input = "<!DOCTYPEa1"
+    output = [["DOCTYPE", "a1", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa9" do
+    input = "<!DOCTYPEa9"
+    output = [["DOCTYPE", "a9", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa<" do
+    input = "<!DOCTYPEa<"
+    output = [["DOCTYPE", "a<", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa=" do
+    input = "<!DOCTYPEa="
+    output = [["DOCTYPE", "a=", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa>" do
+    input = "<!DOCTYPEa>"
+    output = [["DOCTYPE", "a", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa?" do
+    input = "<!DOCTYPEa?"
+    output = [["DOCTYPE", "a?", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa@" do
+    input = "<!DOCTYPEa@"
+    output = [["DOCTYPE", "a@", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEaA" do
+    input = "<!DOCTYPEaA"
+    output = [["DOCTYPE", "aa", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEaB" do
+    input = "<!DOCTYPEaB"
+    output = [["DOCTYPE", "ab", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEaY" do
+    input = "<!DOCTYPEaY"
+    output = [["DOCTYPE", "ay", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEaZ" do
+    input = "<!DOCTYPEaZ"
+    output = [["DOCTYPE", "az", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa[" do
+    input = "<!DOCTYPEa["
+    output = [["DOCTYPE", "a[", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 0>>
+    output = [["DOCTYPE", "a�", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u0008" do
+    input = "<!DOCTYPEa\b"
+    output = [["DOCTYPE", "a\b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u0009" do
+    input = "<!DOCTYPEa\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u000A" do
+    input = "<!DOCTYPEa\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u000B" do
+    input = "<!DOCTYPEa\v"
+    output = [["DOCTYPE", "a\v", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u000C" do
+    input = "<!DOCTYPEa\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u000D" do
+    input = "<!DOCTYPEa\r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 31>>
+    output = [["DOCTYPE", <<97, 31>>, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa􀀀"
+    output = [["DOCTYPE", "a􀀀", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa`" do
+    input = "<!DOCTYPEa`"
+    output = [["DOCTYPE", "a`", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEaa" do
+    input = "<!DOCTYPEaa"
+    output = [["DOCTYPE", "aa", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEab" do
+    input = "<!DOCTYPEab"
+    output = [["DOCTYPE", "ab", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEay" do
+    input = "<!DOCTYPEay"
+    output = [["DOCTYPE", "ay", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEaz" do
+    input = "<!DOCTYPEaz"
+    output = [["DOCTYPE", "az", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa{" do
+    input = "<!DOCTYPEa{"
+    output = [["DOCTYPE", "a{", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEb" do
+    input = "<!DOCTYPEb"
+    output = [["DOCTYPE", "b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEy" do
+    input = "<!DOCTYPEy"
+    output = [["DOCTYPE", "y", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEz" do
+    input = "<!DOCTYPEz"
+    output = [["DOCTYPE", "z", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE{" do
+    input = "<!DOCTYPE{"
+    output = [["DOCTYPE", "{", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!Y" do
+    input = "<!Y"
+    output = [["Comment", "Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!Z" do
+    input = "<!Z"
+    output = [["Comment", "Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\\u0000" do
+    input = <<60, 33, 0>>
+    output = [["Comment", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\\u0009" do
+    input = "<!\t"
+    output = [["Comment", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\\u000A" do
+    input = "<!\n"
+    output = [["Comment", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\\u000B" do
+    input = "<!\v"
+    output = [["Comment", "\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\\u000C" do
+    input = "<!\f"
+    output = [["Comment", "\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\\uDBC0\\uDC00" do
+    input = "<!􀀀"
+    output = [["Comment", "􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!`" do
+    input = "<!`"
+    output = [["Comment", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!a" do
+    input = "<!a"
+    output = [["Comment", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!b" do
+    input = "<!b"
+    output = [["Comment", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!y" do
+    input = "<!y"
+    output = [["Comment", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!z" do
+    input = "<!z"
+    output = [["Comment", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!{" do
+    input = "<!{"
+    output = [["Comment", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\"" do
+    input = "<\""
+    output = [["Character", "<\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <&" do
+    input = "<&"
+    output = [["Character", "<&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <'" do
+    input = "<'"
+    output = [["Character", "<'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <-" do
+    input = "<-"
+    output = [["Character", "<-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <." do
+    input = "<."
+    output = [["Character", "<."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </" do
+    input = "</"
+    output = [["Character", "</"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </ " do
+    input = "</ "
+    output = [["Comment", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </ \\u0000" do
+    input = <<60, 47, 32, 0>>
+    output = [["Comment", " �"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </!" do
+    input = "</!"
+    output = [["Comment", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\"" do
+    input = "</\""
+    output = [["Comment", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </&" do
+    input = "</&"
+    output = [["Comment", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </'" do
+    input = "</'"
+    output = [["Comment", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </-" do
+    input = "</-"
+    output = [["Comment", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <//" do
+    input = "<//"
+    output = [["Comment", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </0" do
+    input = "</0"
+    output = [["Comment", "0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </1" do
+    input = "</1"
+    output = [["Comment", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </9" do
+    input = "</9"
+    output = [["Comment", "9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </<" do
+    input = "</<"
+    output = [["Comment", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </=" do
+    input = "</="
+    output = [["Comment", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </>" do
+    input = "</>"
+    output = []
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </?" do
+    input = "</?"
+    output = [["Comment", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </@" do
+    input = "</@"
+    output = [["Comment", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </A>" do
+    input = "</A>"
+    output = [["EndTag", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </B>" do
+    input = "</B>"
+    output = [["EndTag", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </Y>" do
+    input = "</Y>"
+    output = [["EndTag", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </Z>" do
+    input = "</Z>"
+    output = [["EndTag", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </[" do
+    input = "</["
+    output = [["Comment", "["]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\\u0000" do
+    input = <<60, 47, 0>>
+    output = [["Comment", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\\u0009" do
+    input = "</\t"
+    output = [["Comment", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\\u000A" do
+    input = "</\n"
+    output = [["Comment", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\\u000B" do
+    input = "</\v"
+    output = [["Comment", "\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\\u000C" do
+    input = "</\f"
+    output = [["Comment", "\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </\\uDBC0\\uDC00" do
+    input = "</􀀀"
+    output = [["Comment", "􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </`" do
+    input = "</`"
+    output = [["Comment", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </a>" do
+    input = "</a>"
+    output = [["EndTag", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </b>" do
+    input = "</b>"
+    output = [["EndTag", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </y>" do
+    input = "</y>"
+    output = [["EndTag", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </z>" do
+    input = "</z>"
+    output = [["EndTag", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 </{" do
+    input = "</{"
+    output = [["Comment", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <0" do
+    input = "<0"
+    output = [["Character", "<0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <1" do
+    input = "<1"
+    output = [["Character", "<1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <9" do
+    input = "<9"
+    output = [["Character", "<9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <<" do
+    input = "<<"
+    output = [["Character", "<<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <=" do
+    input = "<="
+    output = [["Character", "<="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <>" do
+    input = "<>"
+    output = [["Character", "<>"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?" do
+    input = "<?"
+    output = [["Comment", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part12_test.exs b/test/floki/html/generated/tokenizer/test3_part12_test.exs
new file mode 100644
index 00000000..2ceaeb81
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part12_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part12Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <? " do
+    input = "<? "
+    output = [["Comment", "? "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <? \\u0000" do
+    input = <<60, 63, 32, 0>>
+    output = [["Comment", "? �"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?!" do
+    input = "<?!"
+    output = [["Comment", "?!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\"" do
+    input = "<?\""
+    output = [["Comment", "?\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?&" do
+    input = "<?&"
+    output = [["Comment", "?&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?'" do
+    input = "<?'"
+    output = [["Comment", "?'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?-" do
+    input = "<?-"
+    output = [["Comment", "?-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?/" do
+    input = "<?/"
+    output = [["Comment", "?/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?0" do
+    input = "<?0"
+    output = [["Comment", "?0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?1" do
+    input = "<?1"
+    output = [["Comment", "?1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?9" do
+    input = "<?9"
+    output = [["Comment", "?9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?<" do
+    input = "<?<"
+    output = [["Comment", "?<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?=" do
+    input = "<?="
+    output = [["Comment", "?="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?>" do
+    input = "<?>"
+    output = [["Comment", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <??" do
+    input = "<??"
+    output = [["Comment", "??"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?@" do
+    input = "<?@"
+    output = [["Comment", "?@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?A" do
+    input = "<?A"
+    output = [["Comment", "?A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?B" do
+    input = "<?B"
+    output = [["Comment", "?B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?Y" do
+    input = "<?Y"
+    output = [["Comment", "?Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?Z" do
+    input = "<?Z"
+    output = [["Comment", "?Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\\u0000" do
+    input = <<60, 63, 0>>
+    output = [["Comment", "?�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\\u0009" do
+    input = "<?\t"
+    output = [["Comment", "?\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\\u000A" do
+    input = "<?\n"
+    output = [["Comment", "?\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\\u000B" do
+    input = "<?\v"
+    output = [["Comment", "?\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\\u000C" do
+    input = "<?\f"
+    output = [["Comment", "?\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?\\uDBC0\\uDC00" do
+    input = "<?􀀀"
+    output = [["Comment", "?􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?`" do
+    input = "<?`"
+    output = [["Comment", "?`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?a" do
+    input = "<?a"
+    output = [["Comment", "?a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?b" do
+    input = "<?b"
+    output = [["Comment", "?b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?y" do
+    input = "<?y"
+    output = [["Comment", "?y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?z" do
+    input = "<?z"
+    output = [["Comment", "?z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <?{" do
+    input = "<?{"
+    output = [["Comment", "?{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <@" do
+    input = "<@"
+    output = [["Character", "<@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <A>" do
+    input = "<A>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <B>" do
+    input = "<B>"
+    output = [["StartTag", "b", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <Y>" do
+    input = "<Y>"
+    output = [["StartTag", "y", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <Z>" do
+    input = "<Z>"
+    output = [["StartTag", "z", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <[" do
+    input = "<["
+    output = [["Character", "<["]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\\u0000" do
+    input = <<60, 0>>
+    output = [["Character", <<60, 0>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\\u0009" do
+    input = "<\t"
+    output = [["Character", "<\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\\u000A" do
+    input = "<\n"
+    output = [["Character", "<\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\\u000B" do
+    input = "<\v"
+    output = [["Character", "<\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\\u000C" do
+    input = "<\f"
+    output = [["Character", "<\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <\\uDBC0\\uDC00" do
+    input = "<􀀀"
+    output = [["Character", "<􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <`" do
+    input = "<`"
+    output = [["Character", "<`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a  >" do
+    input = "<a  >"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a !>" do
+    input = "<a !>"
+    output = [["StartTag", "a", %{"!" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \">" do
+    input = "<a \">"
+    output = [["StartTag", "a", %{"\"" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a #>" do
+    input = "<a #>"
+    output = [["StartTag", "a", %{"#" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a &>" do
+    input = "<a &>"
+    output = [["StartTag", "a", %{"&" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a '>" do
+    input = "<a '>"
+    output = [["StartTag", "a", %{"'" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a (>" do
+    input = "<a (>"
+    output = [["StartTag", "a", %{"(" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a ->" do
+    input = "<a ->"
+    output = [["StartTag", "a", %{"-" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a .>" do
+    input = "<a .>"
+    output = [["StartTag", "a", %{"." => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a />" do
+    input = "<a />"
+    output = [["StartTag", "a", %{}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a 0>" do
+    input = "<a 0>"
+    output = [["StartTag", "a", %{"0" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a 1>" do
+    input = "<a 1>"
+    output = [["StartTag", "a", %{"1" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a 9>" do
+    input = "<a 9>"
+    output = [["StartTag", "a", %{"9" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a <>" do
+    input = "<a <>"
+    output = [["StartTag", "a", %{"<" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a =>" do
+    input = "<a =>"
+    output = [["StartTag", "a", %{"=" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a >" do
+    input = "<a >"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a ?>" do
+    input = "<a ?>"
+    output = [["StartTag", "a", %{"?" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a @>" do
+    input = "<a @>"
+    output = [["StartTag", "a", %{"@" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a A>" do
+    input = "<a A>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a B>" do
+    input = "<a B>"
+    output = [["StartTag", "a", %{"b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a Y>" do
+    input = "<a Y>"
+    output = [["StartTag", "a", %{"y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a Z>" do
+    input = "<a Z>"
+    output = [["StartTag", "a", %{"z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a [>" do
+    input = "<a [>"
+    output = [["StartTag", "a", %{"[" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u0000>" do
+    input = <<60, 97, 32, 0, 62>>
+    output = [["StartTag", "a", %{"�" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u0008>" do
+    input = "<a \b>"
+    output = [["StartTag", "a", %{"\b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u0009>" do
+    input = "<a \t>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u000A>" do
+    input = "<a \n>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u000B>" do
+    input = "<a \v>"
+    output = [["StartTag", "a", %{"\v" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u000C>" do
+    input = "<a \f>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u000D>" do
+    input = "<a \r>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\u001F>" do
+    input = <<60, 97, 32, 31, 62>>
+    output = [["StartTag", "a", %{<<31>> => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a \\uDBC0\\uDC00>" do
+    input = "<a 􀀀>"
+    output = [["StartTag", "a", %{"􀀀" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a `>" do
+    input = "<a `>"
+    output = [["StartTag", "a", %{"`" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a  >" do
+    input = "<a a  >"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a !>" do
+    input = "<a a !>"
+    output = [["StartTag", "a", %{"!" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \">" do
+    input = "<a a \">"
+    output = [["StartTag", "a", %{"\"" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a #>" do
+    input = "<a a #>"
+    output = [["StartTag", "a", %{"#" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a &>" do
+    input = "<a a &>"
+    output = [["StartTag", "a", %{"&" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a '>" do
+    input = "<a a '>"
+    output = [["StartTag", "a", %{"'" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a (>" do
+    input = "<a a (>"
+    output = [["StartTag", "a", %{"(" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a ->" do
+    input = "<a a ->"
+    output = [["StartTag", "a", %{"-" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a .>" do
+    input = "<a a .>"
+    output = [["StartTag", "a", %{"." => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a />" do
+    input = "<a a />"
+    output = [["StartTag", "a", %{"a" => ""}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a 0>" do
+    input = "<a a 0>"
+    output = [["StartTag", "a", %{"0" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a 1>" do
+    input = "<a a 1>"
+    output = [["StartTag", "a", %{"1" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a 9>" do
+    input = "<a a 9>"
+    output = [["StartTag", "a", %{"9" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a <>" do
+    input = "<a a <>"
+    output = [["StartTag", "a", %{"<" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a =>" do
+    input = "<a a =>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a >" do
+    input = "<a a >"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a ?>" do
+    input = "<a a ?>"
+    output = [["StartTag", "a", %{"?" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a @>" do
+    input = "<a a @>"
+    output = [["StartTag", "a", %{"@" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a A>" do
+    input = "<a a A>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a B>" do
+    input = "<a a B>"
+    output = [["StartTag", "a", %{"a" => "", "b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a Y>" do
+    input = "<a a Y>"
+    output = [["StartTag", "a", %{"a" => "", "y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a Z>" do
+    input = "<a a Z>"
+    output = [["StartTag", "a", %{"a" => "", "z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part13_test.exs b/test/floki/html/generated/tokenizer/test3_part13_test.exs
new file mode 100644
index 00000000..db30e780
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part13_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part13Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <a a [>" do
+    input = "<a a [>"
+    output = [["StartTag", "a", %{"[" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u0000>" do
+    input = <<60, 97, 32, 97, 32, 0, 62>>
+    output = [["StartTag", "a", %{"a" => "", "�" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u0008>" do
+    input = "<a a \b>"
+    output = [["StartTag", "a", %{"\b" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u0009>" do
+    input = "<a a \t>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u000A>" do
+    input = "<a a \n>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u000B>" do
+    input = "<a a \v>"
+    output = [["StartTag", "a", %{"\v" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u000C>" do
+    input = "<a a \f>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u000D>" do
+    input = "<a a \r>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\u001F>" do
+    input = <<60, 97, 32, 97, 32, 31, 62>>
+    output = [["StartTag", "a", %{<<31>> => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a \\uDBC0\\uDC00>" do
+    input = "<a a 􀀀>"
+    output = [["StartTag", "a", %{"a" => "", "􀀀" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a `>" do
+    input = "<a a `>"
+    output = [["StartTag", "a", %{"`" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a a>" do
+    input = "<a a a>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a b>" do
+    input = "<a a b>"
+    output = [["StartTag", "a", %{"a" => "", "b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a y>" do
+    input = "<a a y>"
+    output = [["StartTag", "a", %{"a" => "", "y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a z>" do
+    input = "<a a z>"
+    output = [["StartTag", "a", %{"a" => "", "z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a {>" do
+    input = "<a a {>"
+    output = [["StartTag", "a", %{"a" => "", "{" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a!>" do
+    input = "<a a!>"
+    output = [["StartTag", "a", %{"a!" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\">" do
+    input = "<a a\">"
+    output = [["StartTag", "a", %{"a\"" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a#>" do
+    input = "<a a#>"
+    output = [["StartTag", "a", %{"a#" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a&>" do
+    input = "<a a&>"
+    output = [["StartTag", "a", %{"a&" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a'>" do
+    input = "<a a'>"
+    output = [["StartTag", "a", %{"a'" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a(>" do
+    input = "<a a(>"
+    output = [["StartTag", "a", %{"a(" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a->" do
+    input = "<a a->"
+    output = [["StartTag", "a", %{"a-" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a.>" do
+    input = "<a a.>"
+    output = [["StartTag", "a", %{"a." => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a/>" do
+    input = "<a a/>"
+    output = [["StartTag", "a", %{"a" => ""}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a0>" do
+    input = "<a a0>"
+    output = [["StartTag", "a", %{"a0" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a1>" do
+    input = "<a a1>"
+    output = [["StartTag", "a", %{"a1" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a9>" do
+    input = "<a a9>"
+    output = [["StartTag", "a", %{"a9" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a<>" do
+    input = "<a a<>"
+    output = [["StartTag", "a", %{"a<" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a= >" do
+    input = "<a a= >"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=!>" do
+    input = "<a a=!>"
+    output = [["StartTag", "a", %{"a" => "!"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\" \">" do
+    input = "<a a=\" \">"
+    output = [["StartTag", "a", %{"a" => " "}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"!\">" do
+    input = "<a a=\"!\">"
+    output = [["StartTag", "a", %{"a" => "!"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\">" do
+    input = "<a a=\"\">"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"#\">" do
+    input = "<a a=\"#\">"
+    output = [["StartTag", "a", %{"a" => "#"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"%\">" do
+    input = "<a a=\"%\">"
+    output = [["StartTag", "a", %{"a" => "%"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"&\">" do
+    input = "<a a=\"&\">"
+    output = [["StartTag", "a", %{"a" => "&"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"'\">" do
+    input = "<a a=\"'\">"
+    output = [["StartTag", "a", %{"a" => "'"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"-\">" do
+    input = "<a a=\"-\">"
+    output = [["StartTag", "a", %{"a" => "-"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"/\">" do
+    input = "<a a=\"/\">"
+    output = [["StartTag", "a", %{"a" => "/"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"0\">" do
+    input = "<a a=\"0\">"
+    output = [["StartTag", "a", %{"a" => "0"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"1\">" do
+    input = "<a a=\"1\">"
+    output = [["StartTag", "a", %{"a" => "1"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"9\">" do
+    input = "<a a=\"9\">"
+    output = [["StartTag", "a", %{"a" => "9"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"<\">" do
+    input = "<a a=\"<\">"
+    output = [["StartTag", "a", %{"a" => "<"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"=\">" do
+    input = "<a a=\"=\">"
+    output = [["StartTag", "a", %{"a" => "="}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\">\">" do
+    input = "<a a=\">\">"
+    output = [["StartTag", "a", %{"a" => ">"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"?\">" do
+    input = "<a a=\"?\">"
+    output = [["StartTag", "a", %{"a" => "?"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"@\">" do
+    input = "<a a=\"@\">"
+    output = [["StartTag", "a", %{"a" => "@"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"A\">" do
+    input = "<a a=\"A\">"
+    output = [["StartTag", "a", %{"a" => "A"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"B\">" do
+    input = "<a a=\"B\">"
+    output = [["StartTag", "a", %{"a" => "B"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"Y\">" do
+    input = "<a a=\"Y\">"
+    output = [["StartTag", "a", %{"a" => "Y"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"Z\">" do
+    input = "<a a=\"Z\">"
+    output = [["StartTag", "a", %{"a" => "Z"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\\u0000\">" do
+    input = <<60, 97, 32, 97, 61, 34, 0, 34, 62>>
+    output = [["StartTag", "a", %{"a" => "�"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\\u0009\">" do
+    input = "<a a=\"\t\">"
+    output = [["StartTag", "a", %{"a" => "\t"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\\u000A\">" do
+    input = "<a a=\"\n\">"
+    output = [["StartTag", "a", %{"a" => "\n"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\\u000B\">" do
+    input = "<a a=\"\v\">"
+    output = [["StartTag", "a", %{"a" => "\v"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\\u000C\">" do
+    input = "<a a=\"\f\">"
+    output = [["StartTag", "a", %{"a" => "\f"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"\\uDBC0\\uDC00\">" do
+    input = "<a a=\"􀀀\">"
+    output = [["StartTag", "a", %{"a" => "􀀀"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"`\">" do
+    input = "<a a=\"`\">"
+    output = [["StartTag", "a", %{"a" => "`"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"a\">" do
+    input = "<a a=\"a\">"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"b\">" do
+    input = "<a a=\"b\">"
+    output = [["StartTag", "a", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"y\">" do
+    input = "<a a=\"y\">"
+    output = [["StartTag", "a", %{"a" => "y"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"z\">" do
+    input = "<a a=\"z\">"
+    output = [["StartTag", "a", %{"a" => "z"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\"{\">" do
+    input = "<a a=\"{\">"
+    output = [["StartTag", "a", %{"a" => "{"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=#>" do
+    input = "<a a=#>"
+    output = [["StartTag", "a", %{"a" => "#"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=%>" do
+    input = "<a a=%>"
+    output = [["StartTag", "a", %{"a" => "%"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=&>" do
+    input = "<a a=&>"
+    output = [["StartTag", "a", %{"a" => "&"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=' '>" do
+    input = "<a a=' '>"
+    output = [["StartTag", "a", %{"a" => " "}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='!'>" do
+    input = "<a a='!'>"
+    output = [["StartTag", "a", %{"a" => "!"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\"'>" do
+    input = "<a a='\"'>"
+    output = [["StartTag", "a", %{"a" => "\""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='%'>" do
+    input = "<a a='%'>"
+    output = [["StartTag", "a", %{"a" => "%"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='&'>" do
+    input = "<a a='&'>"
+    output = [["StartTag", "a", %{"a" => "&"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='' >" do
+    input = "<a a='' >"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''!>" do
+    input = "<a a=''!>"
+    output = [["StartTag", "a", %{"!" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\">" do
+    input = "<a a=''\">"
+    output = [["StartTag", "a", %{"\"" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''&>" do
+    input = "<a a=''&>"
+    output = [["StartTag", "a", %{"&" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='''>" do
+    input = "<a a='''>"
+    output = [["StartTag", "a", %{"'" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''->" do
+    input = "<a a=''->"
+    output = [["StartTag", "a", %{"-" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''.>" do
+    input = "<a a=''.>"
+    output = [["StartTag", "a", %{"." => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''/>" do
+    input = "<a a=''/>"
+    output = [["StartTag", "a", %{"a" => ""}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''0>" do
+    input = "<a a=''0>"
+    output = [["StartTag", "a", %{"0" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''1>" do
+    input = "<a a=''1>"
+    output = [["StartTag", "a", %{"1" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''9>" do
+    input = "<a a=''9>"
+    output = [["StartTag", "a", %{"9" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''<>" do
+    input = "<a a=''<>"
+    output = [["StartTag", "a", %{"<" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''=>" do
+    input = "<a a=''=>"
+    output = [["StartTag", "a", %{"=" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''>" do
+    input = "<a a=''>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''?>" do
+    input = "<a a=''?>"
+    output = [["StartTag", "a", %{"?" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''@>" do
+    input = "<a a=''@>"
+    output = [["StartTag", "a", %{"@" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''A>" do
+    input = "<a a=''A>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''B>" do
+    input = "<a a=''B>"
+    output = [["StartTag", "a", %{"a" => "", "b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''Y>" do
+    input = "<a a=''Y>"
+    output = [["StartTag", "a", %{"a" => "", "y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''Z>" do
+    input = "<a a=''Z>"
+    output = [["StartTag", "a", %{"a" => "", "z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u0000>" do
+    input = <<60, 97, 32, 97, 61, 39, 39, 0, 62>>
+    output = [["StartTag", "a", %{"a" => "", "�" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u0008>" do
+    input = "<a a=''\b>"
+    output = [["StartTag", "a", %{"\b" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u0009>" do
+    input = "<a a=''\t>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u000A>" do
+    input = "<a a=''\n>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u000B>" do
+    input = "<a a=''\v>"
+    output = [["StartTag", "a", %{"\v" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u000C>" do
+    input = "<a a=''\f>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u000D>" do
+    input = "<a a=''\r>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''\\u001F>" do
+    input = <<60, 97, 32, 97, 61, 39, 39, 31, 62>>
+    output = [["StartTag", "a", %{<<31>> => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part14_test.exs b/test/floki/html/generated/tokenizer/test3_part14_test.exs
new file mode 100644
index 00000000..728a50de
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part14_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part14Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <a a=''\\uDBC0\\uDC00>" do
+    input = "<a a=''􀀀>"
+    output = [["StartTag", "a", %{"a" => "", "􀀀" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''`>" do
+    input = "<a a=''`>"
+    output = [["StartTag", "a", %{"`" => "", "a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''a>" do
+    input = "<a a=''a>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''b>" do
+    input = "<a a=''b>"
+    output = [["StartTag", "a", %{"a" => "", "b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''y>" do
+    input = "<a a=''y>"
+    output = [["StartTag", "a", %{"a" => "", "y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''z>" do
+    input = "<a a=''z>"
+    output = [["StartTag", "a", %{"a" => "", "z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=''{>" do
+    input = "<a a=''{>"
+    output = [["StartTag", "a", %{"a" => "", "{" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='('>" do
+    input = "<a a='('>"
+    output = [["StartTag", "a", %{"a" => "("}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='-'>" do
+    input = "<a a='-'>"
+    output = [["StartTag", "a", %{"a" => "-"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='/'>" do
+    input = "<a a='/'>"
+    output = [["StartTag", "a", %{"a" => "/"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='0'>" do
+    input = "<a a='0'>"
+    output = [["StartTag", "a", %{"a" => "0"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='1'>" do
+    input = "<a a='1'>"
+    output = [["StartTag", "a", %{"a" => "1"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='9'>" do
+    input = "<a a='9'>"
+    output = [["StartTag", "a", %{"a" => "9"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='<'>" do
+    input = "<a a='<'>"
+    output = [["StartTag", "a", %{"a" => "<"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='='>" do
+    input = "<a a='='>"
+    output = [["StartTag", "a", %{"a" => "="}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='>'>" do
+    input = "<a a='>'>"
+    output = [["StartTag", "a", %{"a" => ">"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='?'>" do
+    input = "<a a='?'>"
+    output = [["StartTag", "a", %{"a" => "?"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='@'>" do
+    input = "<a a='@'>"
+    output = [["StartTag", "a", %{"a" => "@"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='A'>" do
+    input = "<a a='A'>"
+    output = [["StartTag", "a", %{"a" => "A"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='B'>" do
+    input = "<a a='B'>"
+    output = [["StartTag", "a", %{"a" => "B"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='Y'>" do
+    input = "<a a='Y'>"
+    output = [["StartTag", "a", %{"a" => "Y"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='Z'>" do
+    input = "<a a='Z'>"
+    output = [["StartTag", "a", %{"a" => "Z"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\\u0000'>" do
+    input = <<60, 97, 32, 97, 61, 39, 0, 39, 62>>
+    output = [["StartTag", "a", %{"a" => "�"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\\u0009'>" do
+    input = "<a a='\t'>"
+    output = [["StartTag", "a", %{"a" => "\t"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\\u000A'>" do
+    input = "<a a='\n'>"
+    output = [["StartTag", "a", %{"a" => "\n"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\\u000B'>" do
+    input = "<a a='\v'>"
+    output = [["StartTag", "a", %{"a" => "\v"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\\u000C'>" do
+    input = "<a a='\f'>"
+    output = [["StartTag", "a", %{"a" => "\f"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='\\uDBC0\\uDC00'>" do
+    input = "<a a='􀀀'>"
+    output = [["StartTag", "a", %{"a" => "􀀀"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='`'>" do
+    input = "<a a='`'>"
+    output = [["StartTag", "a", %{"a" => "`"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='a'>" do
+    input = "<a a='a'>"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='b'>" do
+    input = "<a a='b'>"
+    output = [["StartTag", "a", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='y'>" do
+    input = "<a a='y'>"
+    output = [["StartTag", "a", %{"a" => "y"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='z'>" do
+    input = "<a a='z'>"
+    output = [["StartTag", "a", %{"a" => "z"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a='{'>" do
+    input = "<a a='{'>"
+    output = [["StartTag", "a", %{"a" => "{"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=(>" do
+    input = "<a a=(>"
+    output = [["StartTag", "a", %{"a" => "("}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=->" do
+    input = "<a a=->"
+    output = [["StartTag", "a", %{"a" => "-"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=/>" do
+    input = "<a a=/>"
+    output = [["StartTag", "a", %{"a" => "/"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=0>" do
+    input = "<a a=0>"
+    output = [["StartTag", "a", %{"a" => "0"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=1>" do
+    input = "<a a=1>"
+    output = [["StartTag", "a", %{"a" => "1"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=9>" do
+    input = "<a a=9>"
+    output = [["StartTag", "a", %{"a" => "9"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=<>" do
+    input = "<a a=<>"
+    output = [["StartTag", "a", %{"a" => "<"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a==>" do
+    input = "<a a==>"
+    output = [["StartTag", "a", %{"a" => "="}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=>" do
+    input = "<a a=>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=?>" do
+    input = "<a a=?>"
+    output = [["StartTag", "a", %{"a" => "?"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=@>" do
+    input = "<a a=@>"
+    output = [["StartTag", "a", %{"a" => "@"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=A>" do
+    input = "<a a=A>"
+    output = [["StartTag", "a", %{"a" => "A"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=B>" do
+    input = "<a a=B>"
+    output = [["StartTag", "a", %{"a" => "B"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=Y>" do
+    input = "<a a=Y>"
+    output = [["StartTag", "a", %{"a" => "Y"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=Z>" do
+    input = "<a a=Z>"
+    output = [["StartTag", "a", %{"a" => "Z"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u0000>" do
+    input = <<60, 97, 32, 97, 61, 0, 62>>
+    output = [["StartTag", "a", %{"a" => "�"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u0008>" do
+    input = "<a a=\b>"
+    output = [["StartTag", "a", %{"a" => "\b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u0009>" do
+    input = "<a a=\t>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u000A>" do
+    input = "<a a=\n>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u000B>" do
+    input = "<a a=\v>"
+    output = [["StartTag", "a", %{"a" => "\v"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u000C>" do
+    input = "<a a=\f>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u000D>" do
+    input = "<a a=\r>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\u001F>" do
+    input = <<60, 97, 32, 97, 61, 31, 62>>
+    output = [["StartTag", "a", %{"a" => <<31>>}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=\\uDBC0\\uDC00>" do
+    input = "<a a=􀀀>"
+    output = [["StartTag", "a", %{"a" => "􀀀"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=`>" do
+    input = "<a a=`>"
+    output = [["StartTag", "a", %{"a" => "`"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a >" do
+    input = "<a a=a >"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a!>" do
+    input = "<a a=a!>"
+    output = [["StartTag", "a", %{"a" => "a!"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\">" do
+    input = "<a a=a\">"
+    output = [["StartTag", "a", %{"a" => "a\""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a#>" do
+    input = "<a a=a#>"
+    output = [["StartTag", "a", %{"a" => "a#"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a%>" do
+    input = "<a a=a%>"
+    output = [["StartTag", "a", %{"a" => "a%"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a&>" do
+    input = "<a a=a&>"
+    output = [["StartTag", "a", %{"a" => "a&"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a'>" do
+    input = "<a a=a'>"
+    output = [["StartTag", "a", %{"a" => "a'"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a(>" do
+    input = "<a a=a(>"
+    output = [["StartTag", "a", %{"a" => "a("}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a->" do
+    input = "<a a=a->"
+    output = [["StartTag", "a", %{"a" => "a-"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a/>" do
+    input = "<a a=a/>"
+    output = [["StartTag", "a", %{"a" => "a/"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a0>" do
+    input = "<a a=a0>"
+    output = [["StartTag", "a", %{"a" => "a0"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a1>" do
+    input = "<a a=a1>"
+    output = [["StartTag", "a", %{"a" => "a1"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a9>" do
+    input = "<a a=a9>"
+    output = [["StartTag", "a", %{"a" => "a9"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a<>" do
+    input = "<a a=a<>"
+    output = [["StartTag", "a", %{"a" => "a<"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a=>" do
+    input = "<a a=a=>"
+    output = [["StartTag", "a", %{"a" => "a="}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a>" do
+    input = "<a a=a>"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a?>" do
+    input = "<a a=a?>"
+    output = [["StartTag", "a", %{"a" => "a?"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a@>" do
+    input = "<a a=a@>"
+    output = [["StartTag", "a", %{"a" => "a@"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=aA>" do
+    input = "<a a=aA>"
+    output = [["StartTag", "a", %{"a" => "aA"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=aB>" do
+    input = "<a a=aB>"
+    output = [["StartTag", "a", %{"a" => "aB"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=aY>" do
+    input = "<a a=aY>"
+    output = [["StartTag", "a", %{"a" => "aY"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=aZ>" do
+    input = "<a a=aZ>"
+    output = [["StartTag", "a", %{"a" => "aZ"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u0000>" do
+    input = <<60, 97, 32, 97, 61, 97, 0, 62>>
+    output = [["StartTag", "a", %{"a" => "a�"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u0008>" do
+    input = "<a a=a\b>"
+    output = [["StartTag", "a", %{"a" => "a\b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u0009>" do
+    input = "<a a=a\t>"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u000A>" do
+    input = "<a a=a\n>"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u000B>" do
+    input = "<a a=a\v>"
+    output = [["StartTag", "a", %{"a" => "a\v"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u000C>" do
+    input = "<a a=a\f>"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u000D>" do
+    input = "<a a=a\r>"
+    output = [["StartTag", "a", %{"a" => "a"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\u001F>" do
+    input = <<60, 97, 32, 97, 61, 97, 31, 62>>
+    output = [["StartTag", "a", %{"a" => <<97, 31>>}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a\\uDBC0\\uDC00>" do
+    input = "<a a=a􀀀>"
+    output = [["StartTag", "a", %{"a" => "a􀀀"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a`>" do
+    input = "<a a=a`>"
+    output = [["StartTag", "a", %{"a" => "a`"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=aa>" do
+    input = "<a a=aa>"
+    output = [["StartTag", "a", %{"a" => "aa"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=ab>" do
+    input = "<a a=ab>"
+    output = [["StartTag", "a", %{"a" => "ab"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=ay>" do
+    input = "<a a=ay>"
+    output = [["StartTag", "a", %{"a" => "ay"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=az>" do
+    input = "<a a=az>"
+    output = [["StartTag", "a", %{"a" => "az"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=a{>" do
+    input = "<a a=a{>"
+    output = [["StartTag", "a", %{"a" => "a{"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=b>" do
+    input = "<a a=b>"
+    output = [["StartTag", "a", %{"a" => "b"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=y>" do
+    input = "<a a=y>"
+    output = [["StartTag", "a", %{"a" => "y"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a=z>" do
+    input = "<a a=z>"
+    output = [["StartTag", "a", %{"a" => "z"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a={>" do
+    input = "<a a={>"
+    output = [["StartTag", "a", %{"a" => "{"}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part15_test.exs b/test/floki/html/generated/tokenizer/test3_part15_test.exs
new file mode 100644
index 00000000..85884c1b
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part15_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part15Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <a a>" do
+    input = "<a a>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a?>" do
+    input = "<a a?>"
+    output = [["StartTag", "a", %{"a?" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a@>" do
+    input = "<a a@>"
+    output = [["StartTag", "a", %{"a@" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a aA>" do
+    input = "<a aA>"
+    output = [["StartTag", "a", %{"aa" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a aB>" do
+    input = "<a aB>"
+    output = [["StartTag", "a", %{"ab" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a aY>" do
+    input = "<a aY>"
+    output = [["StartTag", "a", %{"ay" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a aZ>" do
+    input = "<a aZ>"
+    output = [["StartTag", "a", %{"az" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a[>" do
+    input = "<a a[>"
+    output = [["StartTag", "a", %{"a[" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u0000>" do
+    input = <<60, 97, 32, 97, 0, 62>>
+    output = [["StartTag", "a", %{"a�" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u0008>" do
+    input = "<a a\b>"
+    output = [["StartTag", "a", %{"a\b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u0009>" do
+    input = "<a a\t>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u000A>" do
+    input = "<a a\n>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u000B>" do
+    input = "<a a\v>"
+    output = [["StartTag", "a", %{"a\v" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u000C>" do
+    input = "<a a\f>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u000D>" do
+    input = "<a a\r>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\u001F>" do
+    input = <<60, 97, 32, 97, 31, 62>>
+    output = [["StartTag", "a", %{<<97, 31>> => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a\\uDBC0\\uDC00>" do
+    input = "<a a􀀀>"
+    output = [["StartTag", "a", %{"a􀀀" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a`>" do
+    input = "<a a`>"
+    output = [["StartTag", "a", %{"a`" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a aa>" do
+    input = "<a aa>"
+    output = [["StartTag", "a", %{"aa" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a ab>" do
+    input = "<a ab>"
+    output = [["StartTag", "a", %{"ab" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a ay>" do
+    input = "<a ay>"
+    output = [["StartTag", "a", %{"ay" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a az>" do
+    input = "<a az>"
+    output = [["StartTag", "a", %{"az" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a a{>" do
+    input = "<a a{>"
+    output = [["StartTag", "a", %{"a{" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a b>" do
+    input = "<a b>"
+    output = [["StartTag", "a", %{"b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a y>" do
+    input = "<a y>"
+    output = [["StartTag", "a", %{"y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a z>" do
+    input = "<a z>"
+    output = [["StartTag", "a", %{"z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a {>" do
+    input = "<a {>"
+    output = [["StartTag", "a", %{"{" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a!>" do
+    input = "<a!>"
+    output = [["StartTag", "a!", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\">" do
+    input = "<a\">"
+    output = [["StartTag", "a\"", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a&>" do
+    input = "<a&>"
+    output = [["StartTag", "a&", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a'>" do
+    input = "<a'>"
+    output = [["StartTag", "a'", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a->" do
+    input = "<a->"
+    output = [["StartTag", "a-", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a.>" do
+    input = "<a.>"
+    output = [["StartTag", "a.", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/ >" do
+    input = "<a/ >"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/!>" do
+    input = "<a/!>"
+    output = [["StartTag", "a", %{"!" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\">" do
+    input = "<a/\">"
+    output = [["StartTag", "a", %{"\"" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/&>" do
+    input = "<a/&>"
+    output = [["StartTag", "a", %{"&" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/'>" do
+    input = "<a/'>"
+    output = [["StartTag", "a", %{"'" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/->" do
+    input = "<a/->"
+    output = [["StartTag", "a", %{"-" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a//>" do
+    input = "<a//>"
+    output = [["StartTag", "a", %{}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/0>" do
+    input = "<a/0>"
+    output = [["StartTag", "a", %{"0" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/1>" do
+    input = "<a/1>"
+    output = [["StartTag", "a", %{"1" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/9>" do
+    input = "<a/9>"
+    output = [["StartTag", "a", %{"9" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/<>" do
+    input = "<a/<>"
+    output = [["StartTag", "a", %{"<" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/=>" do
+    input = "<a/=>"
+    output = [["StartTag", "a", %{"=" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/>" do
+    input = "<a/>"
+    output = [["StartTag", "a", %{}, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/?>" do
+    input = "<a/?>"
+    output = [["StartTag", "a", %{"?" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/@>" do
+    input = "<a/@>"
+    output = [["StartTag", "a", %{"@" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/A>" do
+    input = "<a/A>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/B>" do
+    input = "<a/B>"
+    output = [["StartTag", "a", %{"b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/Y>" do
+    input = "<a/Y>"
+    output = [["StartTag", "a", %{"y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/Z>" do
+    input = "<a/Z>"
+    output = [["StartTag", "a", %{"z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\\u0000>" do
+    input = <<60, 97, 47, 0, 62>>
+    output = [["StartTag", "a", %{"�" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\\u0009>" do
+    input = "<a/\t>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\\u000A>" do
+    input = "<a/\n>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\\u000B>" do
+    input = "<a/\v>"
+    output = [["StartTag", "a", %{"\v" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\\u000C>" do
+    input = "<a/\f>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/\\uDBC0\\uDC00>" do
+    input = "<a/􀀀>"
+    output = [["StartTag", "a", %{"􀀀" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/`>" do
+    input = "<a/`>"
+    output = [["StartTag", "a", %{"`" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/a>" do
+    input = "<a/a>"
+    output = [["StartTag", "a", %{"a" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/b>" do
+    input = "<a/b>"
+    output = [["StartTag", "a", %{"b" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/y>" do
+    input = "<a/y>"
+    output = [["StartTag", "a", %{"y" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/z>" do
+    input = "<a/z>"
+    output = [["StartTag", "a", %{"z" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a/{>" do
+    input = "<a/{>"
+    output = [["StartTag", "a", %{"{" => ""}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a0>" do
+    input = "<a0>"
+    output = [["StartTag", "a0", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a1>" do
+    input = "<a1>"
+    output = [["StartTag", "a1", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a9>" do
+    input = "<a9>"
+    output = [["StartTag", "a9", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a<>" do
+    input = "<a<>"
+    output = [["StartTag", "a<", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a=>" do
+    input = "<a=>"
+    output = [["StartTag", "a=", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a>" do
+    input = "<a>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a?>" do
+    input = "<a?>"
+    output = [["StartTag", "a?", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a@>" do
+    input = "<a@>"
+    output = [["StartTag", "a@", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <aA>" do
+    input = "<aA>"
+    output = [["StartTag", "aa", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <aB>" do
+    input = "<aB>"
+    output = [["StartTag", "ab", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <aY>" do
+    input = "<aY>"
+    output = [["StartTag", "ay", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <aZ>" do
+    input = "<aZ>"
+    output = [["StartTag", "az", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a[>" do
+    input = "<a[>"
+    output = [["StartTag", "a[", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u0000>" do
+    input = <<60, 97, 0, 62>>
+    output = [["StartTag", "a�", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u0008>" do
+    input = "<a\b>"
+    output = [["StartTag", "a\b", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u0009>" do
+    input = "<a\t>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u000A>" do
+    input = "<a\n>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u000B>" do
+    input = "<a\v>"
+    output = [["StartTag", "a\v", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u000C>" do
+    input = "<a\f>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u000D>" do
+    input = "<a\r>"
+    output = [["StartTag", "a", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\u001F>" do
+    input = <<60, 97, 31, 62>>
+    output = [["StartTag", <<97, 31>>, %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a\\uDBC0\\uDC00>" do
+    input = "<a􀀀>"
+    output = [["StartTag", "a􀀀", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a`>" do
+    input = "<a`>"
+    output = [["StartTag", "a`", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <aa>" do
+    input = "<aa>"
+    output = [["StartTag", "aa", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <ab>" do
+    input = "<ab>"
+    output = [["StartTag", "ab", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <ay>" do
+    input = "<ay>"
+    output = [["StartTag", "ay", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <az>" do
+    input = "<az>"
+    output = [["StartTag", "az", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <a{>" do
+    input = "<a{>"
+    output = [["StartTag", "a{", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <b>" do
+    input = "<b>"
+    output = [["StartTag", "b", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <y>" do
+    input = "<y>"
+    output = [["StartTag", "y", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <z>" do
+    input = "<z>"
+    output = [["StartTag", "z", %{}]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <{" do
+    input = "<{"
+    output = [["Character", "<{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 =" do
+    input = "="
+    output = [["Character", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 >" do
+    input = ">"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 ?" do
+    input = "?"
+    output = [["Character", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 @" do
+    input = "@"
+    output = [["Character", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part16_test.exs b/test/floki/html/generated/tokenizer/test3_part16_test.exs
new file mode 100644
index 00000000..ce3e77c3
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part16_test.exs
@@ -0,0 +1,188 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part16Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 A" do
+    input = "A"
+    output = [["Character", "A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 B" do
+    input = "B"
+    output = [["Character", "B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Y" do
+    input = "Y"
+    output = [["Character", "Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Z" do
+    input = "Z"
+    output = [["Character", "Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 \\u0009" do
+    input = "\t"
+    output = [["Character", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 \\u000A" do
+    input = "\n"
+    output = [["Character", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 \\u000B" do
+    input = "\v"
+    output = [["Character", "\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 \\u000C" do
+    input = "\f"
+    output = [["Character", "\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 \\uDBC0\\uDC00" do
+    input = "􀀀"
+    output = [["Character", "􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 `" do
+    input = "`"
+    output = [["Character", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 a" do
+    input = "a"
+    output = [["Character", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 b" do
+    input = "b"
+    output = [["Character", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 y" do
+    input = "y"
+    output = [["Character", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 z" do
+    input = "z"
+    output = [["Character", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 {" do
+    input = "{"
+    output = [["Character", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part1_test.exs b/test/floki/html/generated/tokenizer/test3_part1_test.exs
new file mode 100644
index 00000000..deefcc37
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part1_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part1Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1  " do
+    input = " "
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 !" do
+    input = "!"
+    output = [["Character", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 \"" do
+    input = "\""
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 %" do
+    input = "%"
+    output = [["Character", "%"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 &" do
+    input = "&"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 '" do
+    input = "'"
+    output = [["Character", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 ," do
+    input = ","
+    output = [["Character", ","]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 -" do
+    input = "-"
+    output = [["Character", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 ." do
+    input = "."
+    output = [["Character", "."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 /" do
+    input = "/"
+    output = [["Character", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 0" do
+    input = "0"
+    output = [["Character", "0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 1" do
+    input = "1"
+    output = [["Character", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 9" do
+    input = "9"
+    output = [["Character", "9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 ;" do
+    input = ";"
+    output = [["Character", ";"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <" do
+    input = "<"
+    output = [["Character", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 < " do
+    input = "< "
+    output = [["Character", "< "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!" do
+    input = "<!"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <! " do
+    input = "<! "
+    output = [["Comment", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <! \\u0000" do
+    input = <<60, 33, 32, 0>>
+    output = [["Comment", " �"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!!" do
+    input = "<!!"
+    output = [["Comment", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!\"" do
+    input = "<!\""
+    output = [["Comment", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!&" do
+    input = "<!&"
+    output = [["Comment", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!'" do
+    input = "<!'"
+    output = [["Comment", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-" do
+    input = "<!-"
+    output = [["Comment", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--" do
+    input = "<!--"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- " do
+    input = "<!-- "
+    output = [["Comment", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--  " do
+    input = "<!--  "
+    output = [["Comment", "  "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- !" do
+    input = "<!-- !"
+    output = [["Comment", " !"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \"" do
+    input = "<!-- \""
+    output = [["Comment", " \""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- &" do
+    input = "<!-- &"
+    output = [["Comment", " &"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- '" do
+    input = "<!-- '"
+    output = [["Comment", " '"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- ," do
+    input = "<!-- ,"
+    output = [["Comment", " ,"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -" do
+    input = "<!-- -"
+    output = [["Comment", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- - " do
+    input = "<!-- - "
+    output = [["Comment", " - "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -!" do
+    input = "<!-- -!"
+    output = [["Comment", " -!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\"" do
+    input = "<!-- -\""
+    output = [["Comment", " -\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -&" do
+    input = "<!-- -&"
+    output = [["Comment", " -&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -'" do
+    input = "<!-- -'"
+    output = [["Comment", " -'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -," do
+    input = "<!-- -,"
+    output = [["Comment", " -,"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- --" do
+    input = "<!-- --"
+    output = [["Comment", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -." do
+    input = "<!-- -."
+    output = [["Comment", " -."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -/" do
+    input = "<!-- -/"
+    output = [["Comment", " -/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -0" do
+    input = "<!-- -0"
+    output = [["Comment", " -0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -1" do
+    input = "<!-- -1"
+    output = [["Comment", " -1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -9" do
+    input = "<!-- -9"
+    output = [["Comment", " -9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -<" do
+    input = "<!-- -<"
+    output = [["Comment", " -<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -=" do
+    input = "<!-- -="
+    output = [["Comment", " -="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- ->" do
+    input = "<!-- ->"
+    output = [["Comment", " ->"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -?" do
+    input = "<!-- -?"
+    output = [["Comment", " -?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -@" do
+    input = "<!-- -@"
+    output = [["Comment", " -@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -A" do
+    input = "<!-- -A"
+    output = [["Comment", " -A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -B" do
+    input = "<!-- -B"
+    output = [["Comment", " -B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -Y" do
+    input = "<!-- -Y"
+    output = [["Comment", " -Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -Z" do
+    input = "<!-- -Z"
+    output = [["Comment", " -Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\\u0000" do
+    input = <<60, 33, 45, 45, 32, 45, 0>>
+    output = [["Comment", " -�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\\u0009" do
+    input = "<!-- -\t"
+    output = [["Comment", " -\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\\u000A" do
+    input = "<!-- -\n"
+    output = [["Comment", " -\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\\u000B" do
+    input = "<!-- -\v"
+    output = [["Comment", " -\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\\u000C" do
+    input = "<!-- -\f"
+    output = [["Comment", " -\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -\\uDBC0\\uDC00" do
+    input = "<!-- -􀀀"
+    output = [["Comment", " -􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -`" do
+    input = "<!-- -`"
+    output = [["Comment", " -`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -a" do
+    input = "<!-- -a"
+    output = [["Comment", " -a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -b" do
+    input = "<!-- -b"
+    output = [["Comment", " -b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -y" do
+    input = "<!-- -y"
+    output = [["Comment", " -y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -z" do
+    input = "<!-- -z"
+    output = [["Comment", " -z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- -{" do
+    input = "<!-- -{"
+    output = [["Comment", " -{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- ." do
+    input = "<!-- ."
+    output = [["Comment", " ."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- /" do
+    input = "<!-- /"
+    output = [["Comment", " /"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- 0" do
+    input = "<!-- 0"
+    output = [["Comment", " 0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- 1" do
+    input = "<!-- 1"
+    output = [["Comment", " 1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- 9" do
+    input = "<!-- 9"
+    output = [["Comment", " 9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- <" do
+    input = "<!-- <"
+    output = [["Comment", " <"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- =" do
+    input = "<!-- ="
+    output = [["Comment", " ="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- >" do
+    input = "<!-- >"
+    output = [["Comment", " >"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- ?" do
+    input = "<!-- ?"
+    output = [["Comment", " ?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- @" do
+    input = "<!-- @"
+    output = [["Comment", " @"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- A" do
+    input = "<!-- A"
+    output = [["Comment", " A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- B" do
+    input = "<!-- B"
+    output = [["Comment", " B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- Y" do
+    input = "<!-- Y"
+    output = [["Comment", " Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- Z" do
+    input = "<!-- Z"
+    output = [["Comment", " Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \\u0000" do
+    input = <<60, 33, 45, 45, 32, 0>>
+    output = [["Comment", " �"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \\u0009" do
+    input = "<!-- \t"
+    output = [["Comment", " \t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \\u000A" do
+    input = "<!-- \n"
+    output = [["Comment", " \n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \\u000B" do
+    input = "<!-- \v"
+    output = [["Comment", " \v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \\u000C" do
+    input = "<!-- \f"
+    output = [["Comment", " \f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- \\uDBC0\\uDC00" do
+    input = "<!-- 􀀀"
+    output = [["Comment", " 􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- `" do
+    input = "<!-- `"
+    output = [["Comment", " `"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- a" do
+    input = "<!-- a"
+    output = [["Comment", " a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- b" do
+    input = "<!-- b"
+    output = [["Comment", " b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- y" do
+    input = "<!-- y"
+    output = [["Comment", " y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- z" do
+    input = "<!-- z"
+    output = [["Comment", " z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-- {" do
+    input = "<!-- {"
+    output = [["Comment", " {"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--!" do
+    input = "<!--!"
+    output = [["Comment", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\"" do
+    input = "<!--\""
+    output = [["Comment", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--&" do
+    input = "<!--&"
+    output = [["Comment", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--'" do
+    input = "<!--'"
+    output = [["Comment", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--," do
+    input = "<!--,"
+    output = [["Comment", ","]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---" do
+    input = "<!---"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--- " do
+    input = "<!--- "
+    output = [["Comment", "- "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---!" do
+    input = "<!---!"
+    output = [["Comment", "-!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part2_test.exs b/test/floki/html/generated/tokenizer/test3_part2_test.exs
new file mode 100644
index 00000000..7157b017
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part2_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part2Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!---\"" do
+    input = "<!---\""
+    output = [["Comment", "-\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---&" do
+    input = "<!---&"
+    output = [["Comment", "-&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---'" do
+    input = "<!---'"
+    output = [["Comment", "-'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---," do
+    input = "<!---,"
+    output = [["Comment", "-,"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----" do
+    input = "<!----"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---- " do
+    input = "<!---- "
+    output = [["Comment", "-- "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----  -->" do
+    input = "<!----  -->"
+    output = [["Comment", "--  "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---- -" do
+    input = "<!---- -"
+    output = [["Comment", "-- "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---- --" do
+    input = "<!---- --"
+    output = [["Comment", "-- "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---- -->" do
+    input = "<!---- -->"
+    output = [["Comment", "-- "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---- a-->" do
+    input = "<!---- a-->"
+    output = [["Comment", "-- a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!" do
+    input = "<!----!"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----! >" do
+    input = "<!----! >"
+    output = [["Comment", "--! >"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!-" do
+    input = "<!----!-"
+    output = [["Comment", "--!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!--" do
+    input = "<!----!--"
+    output = [["Comment", "--!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!-->" do
+    input = "<!----!-->"
+    output = [["Comment", "--!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!>" do
+    input = "<!----!>"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!CR>" do
+    input = "<!----!\r>"
+    output = [["Comment", "--!\n>"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!CRLF>" do
+    input = "<!----!\r\n>"
+    output = [["Comment", "--!\n>"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!LF>" do
+    input = "<!----!\n>"
+    output = [["Comment", "--!\n>"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!a" do
+    input = "<!----!a"
+    output = [["Comment", "--!a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!a-" do
+    input = "<!----!a-"
+    output = [["Comment", "--!a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!a--" do
+    input = "<!----!a--"
+    output = [["Comment", "--!a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----!a-->" do
+    input = "<!----!a-->"
+    output = [["Comment", "--!a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\"" do
+    input = "<!----\""
+    output = [["Comment", "--\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----&" do
+    input = "<!----&"
+    output = [["Comment", "--&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----'" do
+    input = "<!----'"
+    output = [["Comment", "--'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----," do
+    input = "<!----,"
+    output = [["Comment", "--,"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!-----" do
+    input = "<!-----"
+    output = [["Comment", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----." do
+    input = "<!----."
+    output = [["Comment", "--."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----/" do
+    input = "<!----/"
+    output = [["Comment", "--/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----0" do
+    input = "<!----0"
+    output = [["Comment", "--0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----1" do
+    input = "<!----1"
+    output = [["Comment", "--1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----9" do
+    input = "<!----9"
+    output = [["Comment", "--9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----<" do
+    input = "<!----<"
+    output = [["Comment", "--<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----=" do
+    input = "<!----="
+    output = [["Comment", "--="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---->" do
+    input = "<!---->"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----?" do
+    input = "<!----?"
+    output = [["Comment", "--?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----@" do
+    input = "<!----@"
+    output = [["Comment", "--@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----A" do
+    input = "<!----A"
+    output = [["Comment", "--A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----B" do
+    input = "<!----B"
+    output = [["Comment", "--B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----Y" do
+    input = "<!----Y"
+    output = [["Comment", "--Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----Z" do
+    input = "<!----Z"
+    output = [["Comment", "--Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\\u0000" do
+    input = <<60, 33, 45, 45, 45, 45, 0>>
+    output = [["Comment", "--�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\\u0009" do
+    input = "<!----\t"
+    output = [["Comment", "--\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\\u000A" do
+    input = "<!----\n"
+    output = [["Comment", "--\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\\u000B" do
+    input = "<!----\v"
+    output = [["Comment", "--\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\\u000C" do
+    input = "<!----\f"
+    output = [["Comment", "--\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----\\uDBC0\\uDC00" do
+    input = "<!----􀀀"
+    output = [["Comment", "--􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----`" do
+    input = "<!----`"
+    output = [["Comment", "--`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----a" do
+    input = "<!----a"
+    output = [["Comment", "--a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----b" do
+    input = "<!----b"
+    output = [["Comment", "--b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----y" do
+    input = "<!----y"
+    output = [["Comment", "--y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----z" do
+    input = "<!----z"
+    output = [["Comment", "--z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!----{" do
+    input = "<!----{"
+    output = [["Comment", "--{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---." do
+    input = "<!---."
+    output = [["Comment", "-."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---/" do
+    input = "<!---/"
+    output = [["Comment", "-/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---0" do
+    input = "<!---0"
+    output = [["Comment", "-0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---1" do
+    input = "<!---1"
+    output = [["Comment", "-1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---9" do
+    input = "<!---9"
+    output = [["Comment", "-9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---<" do
+    input = "<!---<"
+    output = [["Comment", "-<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---=" do
+    input = "<!---="
+    output = [["Comment", "-="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---?" do
+    input = "<!---?"
+    output = [["Comment", "-?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---@" do
+    input = "<!---@"
+    output = [["Comment", "-@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---A" do
+    input = "<!---A"
+    output = [["Comment", "-A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---B" do
+    input = "<!---B"
+    output = [["Comment", "-B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---Y" do
+    input = "<!---Y"
+    output = [["Comment", "-Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---Z" do
+    input = "<!---Z"
+    output = [["Comment", "-Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---\\u0000" do
+    input = <<60, 33, 45, 45, 45, 0>>
+    output = [["Comment", "-�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---\\u0009" do
+    input = "<!---\t"
+    output = [["Comment", "-\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---\\u000A" do
+    input = "<!---\n"
+    output = [["Comment", "-\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---\\u000B" do
+    input = "<!---\v"
+    output = [["Comment", "-\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---\\u000C" do
+    input = "<!---\f"
+    output = [["Comment", "-\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---\\uDBC0\\uDC00" do
+    input = "<!---􀀀"
+    output = [["Comment", "-􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---`" do
+    input = "<!---`"
+    output = [["Comment", "-`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---a" do
+    input = "<!---a"
+    output = [["Comment", "-a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---b" do
+    input = "<!---b"
+    output = [["Comment", "-b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---y" do
+    input = "<!---y"
+    output = [["Comment", "-y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---z" do
+    input = "<!---z"
+    output = [["Comment", "-z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!---{" do
+    input = "<!---{"
+    output = [["Comment", "-{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--." do
+    input = "<!--."
+    output = [["Comment", "."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--/" do
+    input = "<!--/"
+    output = [["Comment", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--0" do
+    input = "<!--0"
+    output = [["Comment", "0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--1" do
+    input = "<!--1"
+    output = [["Comment", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--9" do
+    input = "<!--9"
+    output = [["Comment", "9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--<" do
+    input = "<!--<"
+    output = [["Comment", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--=" do
+    input = "<!--="
+    output = [["Comment", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--?" do
+    input = "<!--?"
+    output = [["Comment", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--@" do
+    input = "<!--@"
+    output = [["Comment", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--A" do
+    input = "<!--A"
+    output = [["Comment", "A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--B" do
+    input = "<!--B"
+    output = [["Comment", "B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--Y" do
+    input = "<!--Y"
+    output = [["Comment", "Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--Z" do
+    input = "<!--Z"
+    output = [["Comment", "Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\\u0000" do
+    input = <<60, 33, 45, 45, 0>>
+    output = [["Comment", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\\u0009" do
+    input = "<!--\t"
+    output = [["Comment", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\\u000A" do
+    input = "<!--\n"
+    output = [["Comment", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\\u000B" do
+    input = "<!--\v"
+    output = [["Comment", "\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\\u000C" do
+    input = "<!--\f"
+    output = [["Comment", "\f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--\\uDBC0\\uDC00" do
+    input = "<!--􀀀"
+    output = [["Comment", "􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--`" do
+    input = "<!--`"
+    output = [["Comment", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part3_test.exs b/test/floki/html/generated/tokenizer/test3_part3_test.exs
new file mode 100644
index 00000000..a984490c
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part3_test.exs
@@ -0,0 +1,1210 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part3Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!--a" do
+    input = "<!--a"
+    output = [["Comment", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--b" do
+    input = "<!--b"
+    output = [["Comment", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--y" do
+    input = "<!--y"
+    output = [["Comment", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--z" do
+    input = "<!--z"
+    output = [["Comment", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!--{" do
+    input = "<!--{"
+    output = [["Comment", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!/" do
+    input = "<!/"
+    output = [["Comment", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!0" do
+    input = "<!0"
+    output = [["Comment", "0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!1" do
+    input = "<!1"
+    output = [["Comment", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!9" do
+    input = "<!9"
+    output = [["Comment", "9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!<" do
+    input = "<!<"
+    output = [["Comment", "<"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!=" do
+    input = "<!="
+    output = [["Comment", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!>" do
+    input = "<!>"
+    output = [["Comment", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!?" do
+    input = "<!?"
+    output = [["Comment", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!@" do
+    input = "<!@"
+    output = [["Comment", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!A" do
+    input = "<!A"
+    output = [["Comment", "A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!B" do
+    input = "<!B"
+    output = [["Comment", "B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE" do
+    input = "<!DOCTYPE"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE " do
+    input = "<!DOCTYPE "
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE  " do
+    input = "<!DOCTYPE  "
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE !" do
+    input = "<!DOCTYPE !"
+    output = [["DOCTYPE", "!", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \"" do
+    input = "<!DOCTYPE \""
+    output = [["DOCTYPE", "\"", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE &" do
+    input = "<!DOCTYPE &"
+    output = [["DOCTYPE", "&", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE '" do
+    input = "<!DOCTYPE '"
+    output = [["DOCTYPE", "'", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE -" do
+    input = "<!DOCTYPE -"
+    output = [["DOCTYPE", "-", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE /" do
+    input = "<!DOCTYPE /"
+    output = [["DOCTYPE", "/", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE 0" do
+    input = "<!DOCTYPE 0"
+    output = [["DOCTYPE", "0", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE 1" do
+    input = "<!DOCTYPE 1"
+    output = [["DOCTYPE", "1", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE 9" do
+    input = "<!DOCTYPE 9"
+    output = [["DOCTYPE", "9", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE <" do
+    input = "<!DOCTYPE <"
+    output = [["DOCTYPE", "<", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE =" do
+    input = "<!DOCTYPE ="
+    output = [["DOCTYPE", "=", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE >" do
+    input = "<!DOCTYPE >"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE ?" do
+    input = "<!DOCTYPE ?"
+    output = [["DOCTYPE", "?", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE @" do
+    input = "<!DOCTYPE @"
+    output = [["DOCTYPE", "@", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE A" do
+    input = "<!DOCTYPE A"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE B" do
+    input = "<!DOCTYPE B"
+    output = [["DOCTYPE", "b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE Y" do
+    input = "<!DOCTYPE Y"
+    output = [["DOCTYPE", "y", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE Z" do
+    input = "<!DOCTYPE Z"
+    output = [["DOCTYPE", "z", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE [" do
+    input = "<!DOCTYPE ["
+    output = [["DOCTYPE", "[", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 0>>
+    output = [["DOCTYPE", "�", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u0008" do
+    input = "<!DOCTYPE \b"
+    output = [["DOCTYPE", "\b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u0009" do
+    input = "<!DOCTYPE \t"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u000A" do
+    input = "<!DOCTYPE \n"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u000B" do
+    input = "<!DOCTYPE \v"
+    output = [["DOCTYPE", "\v", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u000C" do
+    input = "<!DOCTYPE \f"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u000D" do
+    input = "<!DOCTYPE \r"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 31>>
+    output = [["DOCTYPE", <<31>>, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE \\uDBC0\\uDC00" do
+    input = "<!DOCTYPE 􀀀"
+    output = [["DOCTYPE", "􀀀", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE `" do
+    input = "<!DOCTYPE `"
+    output = [["DOCTYPE", "`", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a" do
+    input = "<!DOCTYPE a"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a " do
+    input = "<!DOCTYPE a "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a  " do
+    input = "<!DOCTYPE a  "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a !" do
+    input = "<!DOCTYPE a !"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \"" do
+    input = "<!DOCTYPE a \""
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a &" do
+    input = "<!DOCTYPE a &"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a '" do
+    input = "<!DOCTYPE a '"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a -" do
+    input = "<!DOCTYPE a -"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a /" do
+    input = "<!DOCTYPE a /"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a 0" do
+    input = "<!DOCTYPE a 0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a 1" do
+    input = "<!DOCTYPE a 1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a 9" do
+    input = "<!DOCTYPE a 9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a <" do
+    input = "<!DOCTYPE a <"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a =" do
+    input = "<!DOCTYPE a ="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a >" do
+    input = "<!DOCTYPE a >"
+    output = [["DOCTYPE", "a", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a ?" do
+    input = "<!DOCTYPE a ?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a @" do
+    input = "<!DOCTYPE a @"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a A" do
+    input = "<!DOCTYPE a A"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a B" do
+    input = "<!DOCTYPE a B"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC" do
+    input = "<!DOCTYPE a PUBLIC"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC " do
+    input = "<!DOCTYPE a PUBLIC "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC!" do
+    input = "<!DOCTYPE a PUBLIC!"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"" do
+    input = "<!DOCTYPE a PUBLIC\""
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\" " do
+    input = "<!DOCTYPE a PUBLIC\" "
+    output = [["DOCTYPE", "a", " ", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"!" do
+    input = "<!DOCTYPE a PUBLIC\"!"
+    output = [["DOCTYPE", "a", "!", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\"" do
+    input = "<!DOCTYPE a PUBLIC\"\""
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\" \\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 34, 34, 32, 0>>
+
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\"\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 34, 34, 0>>
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"#" do
+    input = "<!DOCTYPE a PUBLIC\"#"
+    output = [["DOCTYPE", "a", "#", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"&" do
+    input = "<!DOCTYPE a PUBLIC\"&"
+    output = [["DOCTYPE", "a", "&", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"'" do
+    input = "<!DOCTYPE a PUBLIC\"'"
+    output = [["DOCTYPE", "a", "'", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"-" do
+    input = "<!DOCTYPE a PUBLIC\"-"
+    output = [["DOCTYPE", "a", "-", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"/" do
+    input = "<!DOCTYPE a PUBLIC\"/"
+    output = [["DOCTYPE", "a", "/", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"0" do
+    input = "<!DOCTYPE a PUBLIC\"0"
+    output = [["DOCTYPE", "a", "0", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"1" do
+    input = "<!DOCTYPE a PUBLIC\"1"
+    output = [["DOCTYPE", "a", "1", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"9" do
+    input = "<!DOCTYPE a PUBLIC\"9"
+    output = [["DOCTYPE", "a", "9", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"<" do
+    input = "<!DOCTYPE a PUBLIC\"<"
+    output = [["DOCTYPE", "a", "<", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"=" do
+    input = "<!DOCTYPE a PUBLIC\"="
+    output = [["DOCTYPE", "a", "=", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\">" do
+    input = "<!DOCTYPE a PUBLIC\">"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"?" do
+    input = "<!DOCTYPE a PUBLIC\"?"
+    output = [["DOCTYPE", "a", "?", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"@" do
+    input = "<!DOCTYPE a PUBLIC\"@"
+    output = [["DOCTYPE", "a", "@", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"A" do
+    input = "<!DOCTYPE a PUBLIC\"A"
+    output = [["DOCTYPE", "a", "A", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"B" do
+    input = "<!DOCTYPE a PUBLIC\"B"
+    output = [["DOCTYPE", "a", "B", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"Y" do
+    input = "<!DOCTYPE a PUBLIC\"Y"
+    output = [["DOCTYPE", "a", "Y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"Z" do
+    input = "<!DOCTYPE a PUBLIC\"Z"
+    output = [["DOCTYPE", "a", "Z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 34, 0>>
+    output = [["DOCTYPE", "a", "�", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\\u0009" do
+    input = "<!DOCTYPE a PUBLIC\"\t"
+    output = [["DOCTYPE", "a", "\t", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\\u000A" do
+    input = "<!DOCTYPE a PUBLIC\"\n"
+    output = [["DOCTYPE", "a", "\n", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\\u000B" do
+    input = "<!DOCTYPE a PUBLIC\"\v"
+    output = [["DOCTYPE", "a", "\v", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\\u000C" do
+    input = "<!DOCTYPE a PUBLIC\"\f"
+    output = [["DOCTYPE", "a", "\f", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a PUBLIC\"􀀀"
+    output = [["DOCTYPE", "a", "􀀀", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"`" do
+    input = "<!DOCTYPE a PUBLIC\"`"
+    output = [["DOCTYPE", "a", "`", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part4_test.exs b/test/floki/html/generated/tokenizer/test3_part4_test.exs
new file mode 100644
index 00000000..25a496cb
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part4_test.exs
@@ -0,0 +1,1220 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part4Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"a" do
+    input = "<!DOCTYPE a PUBLIC\"a"
+    output = [["DOCTYPE", "a", "a", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"b" do
+    input = "<!DOCTYPE a PUBLIC\"b"
+    output = [["DOCTYPE", "a", "b", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"y" do
+    input = "<!DOCTYPE a PUBLIC\"y"
+    output = [["DOCTYPE", "a", "y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"z" do
+    input = "<!DOCTYPE a PUBLIC\"z"
+    output = [["DOCTYPE", "a", "z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\"{" do
+    input = "<!DOCTYPE a PUBLIC\"{"
+    output = [["DOCTYPE", "a", "{", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC#" do
+    input = "<!DOCTYPE a PUBLIC#"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC&" do
+    input = "<!DOCTYPE a PUBLIC&"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'" do
+    input = "<!DOCTYPE a PUBLIC'"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC' " do
+    input = "<!DOCTYPE a PUBLIC' "
+    output = [["DOCTYPE", "a", " ", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'!" do
+    input = "<!DOCTYPE a PUBLIC'!"
+    output = [["DOCTYPE", "a", "!", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\"" do
+    input = "<!DOCTYPE a PUBLIC'\""
+    output = [["DOCTYPE", "a", "\"", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'&" do
+    input = "<!DOCTYPE a PUBLIC'&"
+    output = [["DOCTYPE", "a", "&", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''" do
+    input = "<!DOCTYPE a PUBLIC''"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'' " do
+    input = "<!DOCTYPE a PUBLIC'' "
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''!" do
+    input = "<!DOCTYPE a PUBLIC''!"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\"" do
+    input = "<!DOCTYPE a PUBLIC''\""
+    output = [["DOCTYPE", "a", "", "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''#" do
+    input = "<!DOCTYPE a PUBLIC''#"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''&" do
+    input = "<!DOCTYPE a PUBLIC''&"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'''" do
+    input = "<!DOCTYPE a PUBLIC'''"
+    output = [["DOCTYPE", "a", "", "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'''' \\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 39, 39,
+        32, 0>>
+
+    output = [["DOCTYPE", "a", "", "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'''' x\\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 39, 39,
+        32, 120, 0>>
+
+    output = [["DOCTYPE", "a", "", "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''''\\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 39, 39,
+        0>>
+
+    output = [["DOCTYPE", "a", "", "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''''x\\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 39, 39,
+        120, 0>>
+
+    output = [["DOCTYPE", "a", "", "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''(" do
+    input = "<!DOCTYPE a PUBLIC''("
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''-" do
+    input = "<!DOCTYPE a PUBLIC''-"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''/" do
+    input = "<!DOCTYPE a PUBLIC''/"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''0" do
+    input = "<!DOCTYPE a PUBLIC''0"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''1" do
+    input = "<!DOCTYPE a PUBLIC''1"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''9" do
+    input = "<!DOCTYPE a PUBLIC''9"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''<" do
+    input = "<!DOCTYPE a PUBLIC''<"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''=" do
+    input = "<!DOCTYPE a PUBLIC''="
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''>" do
+    input = "<!DOCTYPE a PUBLIC''>"
+    output = [["DOCTYPE", "a", "", nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''?" do
+    input = "<!DOCTYPE a PUBLIC''?"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''@" do
+    input = "<!DOCTYPE a PUBLIC''@"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''A" do
+    input = "<!DOCTYPE a PUBLIC''A"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''B" do
+    input = "<!DOCTYPE a PUBLIC''B"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''Y" do
+    input = "<!DOCTYPE a PUBLIC''Y"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''Z" do
+    input = "<!DOCTYPE a PUBLIC''Z"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 0>>
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u0008" do
+    input = "<!DOCTYPE a PUBLIC''\b"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u0009" do
+    input = "<!DOCTYPE a PUBLIC''\t"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u000A" do
+    input = "<!DOCTYPE a PUBLIC''\n"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u000B" do
+    input = "<!DOCTYPE a PUBLIC''\v"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u000C" do
+    input = "<!DOCTYPE a PUBLIC''\f"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u000D" do
+    input = "<!DOCTYPE a PUBLIC''\r"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 31>>
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a PUBLIC''􀀀"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''`" do
+    input = "<!DOCTYPE a PUBLIC''`"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''a" do
+    input = "<!DOCTYPE a PUBLIC''a"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''b" do
+    input = "<!DOCTYPE a PUBLIC''b"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''y" do
+    input = "<!DOCTYPE a PUBLIC''y"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''z" do
+    input = "<!DOCTYPE a PUBLIC''z"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC''{" do
+    input = "<!DOCTYPE a PUBLIC''{"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'(" do
+    input = "<!DOCTYPE a PUBLIC'("
+    output = [["DOCTYPE", "a", "(", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'-" do
+    input = "<!DOCTYPE a PUBLIC'-"
+    output = [["DOCTYPE", "a", "-", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'/" do
+    input = "<!DOCTYPE a PUBLIC'/"
+    output = [["DOCTYPE", "a", "/", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'0" do
+    input = "<!DOCTYPE a PUBLIC'0"
+    output = [["DOCTYPE", "a", "0", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'1" do
+    input = "<!DOCTYPE a PUBLIC'1"
+    output = [["DOCTYPE", "a", "1", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'9" do
+    input = "<!DOCTYPE a PUBLIC'9"
+    output = [["DOCTYPE", "a", "9", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'<" do
+    input = "<!DOCTYPE a PUBLIC'<"
+    output = [["DOCTYPE", "a", "<", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'=" do
+    input = "<!DOCTYPE a PUBLIC'="
+    output = [["DOCTYPE", "a", "=", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'>" do
+    input = "<!DOCTYPE a PUBLIC'>"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'?" do
+    input = "<!DOCTYPE a PUBLIC'?"
+    output = [["DOCTYPE", "a", "?", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'@" do
+    input = "<!DOCTYPE a PUBLIC'@"
+    output = [["DOCTYPE", "a", "@", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'A" do
+    input = "<!DOCTYPE a PUBLIC'A"
+    output = [["DOCTYPE", "a", "A", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'B" do
+    input = "<!DOCTYPE a PUBLIC'B"
+    output = [["DOCTYPE", "a", "B", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'Y" do
+    input = "<!DOCTYPE a PUBLIC'Y"
+    output = [["DOCTYPE", "a", "Y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'Z" do
+    input = "<!DOCTYPE a PUBLIC'Z"
+    output = [["DOCTYPE", "a", "Z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 39, 0>>
+    output = [["DOCTYPE", "a", "�", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\\u0009" do
+    input = "<!DOCTYPE a PUBLIC'\t"
+    output = [["DOCTYPE", "a", "\t", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\\u000A" do
+    input = "<!DOCTYPE a PUBLIC'\n"
+    output = [["DOCTYPE", "a", "\n", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\\u000B" do
+    input = "<!DOCTYPE a PUBLIC'\v"
+    output = [["DOCTYPE", "a", "\v", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\\u000C" do
+    input = "<!DOCTYPE a PUBLIC'\f"
+    output = [["DOCTYPE", "a", "\f", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a PUBLIC'􀀀"
+    output = [["DOCTYPE", "a", "􀀀", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'`" do
+    input = "<!DOCTYPE a PUBLIC'`"
+    output = [["DOCTYPE", "a", "`", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'a" do
+    input = "<!DOCTYPE a PUBLIC'a"
+    output = [["DOCTYPE", "a", "a", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'b" do
+    input = "<!DOCTYPE a PUBLIC'b"
+    output = [["DOCTYPE", "a", "b", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'y" do
+    input = "<!DOCTYPE a PUBLIC'y"
+    output = [["DOCTYPE", "a", "y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'z" do
+    input = "<!DOCTYPE a PUBLIC'z"
+    output = [["DOCTYPE", "a", "z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC'{" do
+    input = "<!DOCTYPE a PUBLIC'{"
+    output = [["DOCTYPE", "a", "{", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC(" do
+    input = "<!DOCTYPE a PUBLIC("
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC-" do
+    input = "<!DOCTYPE a PUBLIC-"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC/" do
+    input = "<!DOCTYPE a PUBLIC/"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC0" do
+    input = "<!DOCTYPE a PUBLIC0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC1" do
+    input = "<!DOCTYPE a PUBLIC1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC9" do
+    input = "<!DOCTYPE a PUBLIC9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC<" do
+    input = "<!DOCTYPE a PUBLIC<"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC=" do
+    input = "<!DOCTYPE a PUBLIC="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC>" do
+    input = "<!DOCTYPE a PUBLIC>"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC?" do
+    input = "<!DOCTYPE a PUBLIC?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC@" do
+    input = "<!DOCTYPE a PUBLIC@"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICA" do
+    input = "<!DOCTYPE a PUBLICA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICB" do
+    input = "<!DOCTYPE a PUBLICB"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICY" do
+    input = "<!DOCTYPE a PUBLICY"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICZ" do
+    input = "<!DOCTYPE a PUBLICZ"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u0008" do
+    input = "<!DOCTYPE a PUBLIC\b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u0009" do
+    input = "<!DOCTYPE a PUBLIC\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u000A" do
+    input = "<!DOCTYPE a PUBLIC\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u000B" do
+    input = "<!DOCTYPE a PUBLIC\v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part5_test.exs b/test/floki/html/generated/tokenizer/test3_part5_test.exs
new file mode 100644
index 00000000..f83d3d7a
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part5_test.exs
@@ -0,0 +1,1213 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part5Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u000C" do
+    input = "<!DOCTYPE a PUBLIC\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u000D" do
+    input = "<!DOCTYPE a PUBLIC\r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 80, 85, 66, 76, 73, 67, 31>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a PUBLIC􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC`" do
+    input = "<!DOCTYPE a PUBLIC`"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICa" do
+    input = "<!DOCTYPE a PUBLICa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICb" do
+    input = "<!DOCTYPE a PUBLICb"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICy" do
+    input = "<!DOCTYPE a PUBLICy"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLICz" do
+    input = "<!DOCTYPE a PUBLICz"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a PUBLIC{" do
+    input = "<!DOCTYPE a PUBLIC{"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM" do
+    input = "<!DOCTYPE a SYSTEM"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM " do
+    input = "<!DOCTYPE a SYSTEM "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM \\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 32, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM x\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 32, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM!" do
+    input = "<!DOCTYPE a SYSTEM!"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"" do
+    input = "<!DOCTYPE a SYSTEM\""
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\" " do
+    input = "<!DOCTYPE a SYSTEM\" "
+    output = [["DOCTYPE", "a", nil, " ", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"!" do
+    input = "<!DOCTYPE a SYSTEM\"!"
+    output = [["DOCTYPE", "a", nil, "!", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\"" do
+    input = "<!DOCTYPE a SYSTEM\"\""
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"#" do
+    input = "<!DOCTYPE a SYSTEM\"#"
+    output = [["DOCTYPE", "a", nil, "#", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"&" do
+    input = "<!DOCTYPE a SYSTEM\"&"
+    output = [["DOCTYPE", "a", nil, "&", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"'" do
+    input = "<!DOCTYPE a SYSTEM\"'"
+    output = [["DOCTYPE", "a", nil, "'", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"-" do
+    input = "<!DOCTYPE a SYSTEM\"-"
+    output = [["DOCTYPE", "a", nil, "-", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"/" do
+    input = "<!DOCTYPE a SYSTEM\"/"
+    output = [["DOCTYPE", "a", nil, "/", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"0" do
+    input = "<!DOCTYPE a SYSTEM\"0"
+    output = [["DOCTYPE", "a", nil, "0", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"1" do
+    input = "<!DOCTYPE a SYSTEM\"1"
+    output = [["DOCTYPE", "a", nil, "1", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"9" do
+    input = "<!DOCTYPE a SYSTEM\"9"
+    output = [["DOCTYPE", "a", nil, "9", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"<" do
+    input = "<!DOCTYPE a SYSTEM\"<"
+    output = [["DOCTYPE", "a", nil, "<", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"=" do
+    input = "<!DOCTYPE a SYSTEM\"="
+    output = [["DOCTYPE", "a", nil, "=", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\">" do
+    input = "<!DOCTYPE a SYSTEM\">"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"?" do
+    input = "<!DOCTYPE a SYSTEM\"?"
+    output = [["DOCTYPE", "a", nil, "?", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"@" do
+    input = "<!DOCTYPE a SYSTEM\"@"
+    output = [["DOCTYPE", "a", nil, "@", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"A" do
+    input = "<!DOCTYPE a SYSTEM\"A"
+    output = [["DOCTYPE", "a", nil, "A", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"B" do
+    input = "<!DOCTYPE a SYSTEM\"B"
+    output = [["DOCTYPE", "a", nil, "B", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"Y" do
+    input = "<!DOCTYPE a SYSTEM\"Y"
+    output = [["DOCTYPE", "a", nil, "Y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"Z" do
+    input = "<!DOCTYPE a SYSTEM\"Z"
+    output = [["DOCTYPE", "a", nil, "Z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 34, 0>>
+    output = [["DOCTYPE", "a", nil, "�", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\\u0009" do
+    input = "<!DOCTYPE a SYSTEM\"\t"
+    output = [["DOCTYPE", "a", nil, "\t", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\\u000A" do
+    input = "<!DOCTYPE a SYSTEM\"\n"
+    output = [["DOCTYPE", "a", nil, "\n", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\\u000B" do
+    input = "<!DOCTYPE a SYSTEM\"\v"
+    output = [["DOCTYPE", "a", nil, "\v", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\\u000C" do
+    input = "<!DOCTYPE a SYSTEM\"\f"
+    output = [["DOCTYPE", "a", nil, "\f", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a SYSTEM\"􀀀"
+    output = [["DOCTYPE", "a", nil, "􀀀", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"`" do
+    input = "<!DOCTYPE a SYSTEM\"`"
+    output = [["DOCTYPE", "a", nil, "`", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"a" do
+    input = "<!DOCTYPE a SYSTEM\"a"
+    output = [["DOCTYPE", "a", nil, "a", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"b" do
+    input = "<!DOCTYPE a SYSTEM\"b"
+    output = [["DOCTYPE", "a", nil, "b", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"y" do
+    input = "<!DOCTYPE a SYSTEM\"y"
+    output = [["DOCTYPE", "a", nil, "y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"z" do
+    input = "<!DOCTYPE a SYSTEM\"z"
+    output = [["DOCTYPE", "a", nil, "z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\"{" do
+    input = "<!DOCTYPE a SYSTEM\"{"
+    output = [["DOCTYPE", "a", nil, "{", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM#" do
+    input = "<!DOCTYPE a SYSTEM#"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM&" do
+    input = "<!DOCTYPE a SYSTEM&"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'" do
+    input = "<!DOCTYPE a SYSTEM'"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM' " do
+    input = "<!DOCTYPE a SYSTEM' "
+    output = [["DOCTYPE", "a", nil, " ", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'!" do
+    input = "<!DOCTYPE a SYSTEM'!"
+    output = [["DOCTYPE", "a", nil, "!", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\"" do
+    input = "<!DOCTYPE a SYSTEM'\""
+    output = [["DOCTYPE", "a", nil, "\"", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'&" do
+    input = "<!DOCTYPE a SYSTEM'&"
+    output = [["DOCTYPE", "a", nil, "&", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''" do
+    input = "<!DOCTYPE a SYSTEM''"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'' " do
+    input = "<!DOCTYPE a SYSTEM'' "
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'' \\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 39, 39, 32, 0>>
+
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'' x\\u0000" do
+    input =
+      <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 39, 39, 32, 120,
+        0>>
+
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''!" do
+    input = "<!DOCTYPE a SYSTEM''!"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\"" do
+    input = "<!DOCTYPE a SYSTEM''\""
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''&" do
+    input = "<!DOCTYPE a SYSTEM''&"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'''" do
+    input = "<!DOCTYPE a SYSTEM'''"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''-" do
+    input = "<!DOCTYPE a SYSTEM''-"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''/" do
+    input = "<!DOCTYPE a SYSTEM''/"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''0" do
+    input = "<!DOCTYPE a SYSTEM''0"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''1" do
+    input = "<!DOCTYPE a SYSTEM''1"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''9" do
+    input = "<!DOCTYPE a SYSTEM''9"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''<" do
+    input = "<!DOCTYPE a SYSTEM''<"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''=" do
+    input = "<!DOCTYPE a SYSTEM''="
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''>" do
+    input = "<!DOCTYPE a SYSTEM''>"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''?" do
+    input = "<!DOCTYPE a SYSTEM''?"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''@" do
+    input = "<!DOCTYPE a SYSTEM''@"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''A" do
+    input = "<!DOCTYPE a SYSTEM''A"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''B" do
+    input = "<!DOCTYPE a SYSTEM''B"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''Y" do
+    input = "<!DOCTYPE a SYSTEM''Y"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''Z" do
+    input = "<!DOCTYPE a SYSTEM''Z"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 39, 39, 0>>
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u0008" do
+    input = "<!DOCTYPE a SYSTEM''\b"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u0009" do
+    input = "<!DOCTYPE a SYSTEM''\t"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u000A" do
+    input = "<!DOCTYPE a SYSTEM''\n"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u000B" do
+    input = "<!DOCTYPE a SYSTEM''\v"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u000C" do
+    input = "<!DOCTYPE a SYSTEM''\f"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u000D" do
+    input = "<!DOCTYPE a SYSTEM''\r"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 39, 39, 31>>
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a SYSTEM''􀀀"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''`" do
+    input = "<!DOCTYPE a SYSTEM''`"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''a" do
+    input = "<!DOCTYPE a SYSTEM''a"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''b" do
+    input = "<!DOCTYPE a SYSTEM''b"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''y" do
+    input = "<!DOCTYPE a SYSTEM''y"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''z" do
+    input = "<!DOCTYPE a SYSTEM''z"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM''{" do
+    input = "<!DOCTYPE a SYSTEM''{"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'(" do
+    input = "<!DOCTYPE a SYSTEM'("
+    output = [["DOCTYPE", "a", nil, "(", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'-" do
+    input = "<!DOCTYPE a SYSTEM'-"
+    output = [["DOCTYPE", "a", nil, "-", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'/" do
+    input = "<!DOCTYPE a SYSTEM'/"
+    output = [["DOCTYPE", "a", nil, "/", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'0" do
+    input = "<!DOCTYPE a SYSTEM'0"
+    output = [["DOCTYPE", "a", nil, "0", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'1" do
+    input = "<!DOCTYPE a SYSTEM'1"
+    output = [["DOCTYPE", "a", nil, "1", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'9" do
+    input = "<!DOCTYPE a SYSTEM'9"
+    output = [["DOCTYPE", "a", nil, "9", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'<" do
+    input = "<!DOCTYPE a SYSTEM'<"
+    output = [["DOCTYPE", "a", nil, "<", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'=" do
+    input = "<!DOCTYPE a SYSTEM'="
+    output = [["DOCTYPE", "a", nil, "=", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part6_test.exs b/test/floki/html/generated/tokenizer/test3_part6_test.exs
new file mode 100644
index 00000000..7afb3903
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part6_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part6Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'>" do
+    input = "<!DOCTYPE a SYSTEM'>"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'?" do
+    input = "<!DOCTYPE a SYSTEM'?"
+    output = [["DOCTYPE", "a", nil, "?", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'@" do
+    input = "<!DOCTYPE a SYSTEM'@"
+    output = [["DOCTYPE", "a", nil, "@", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'A" do
+    input = "<!DOCTYPE a SYSTEM'A"
+    output = [["DOCTYPE", "a", nil, "A", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'B" do
+    input = "<!DOCTYPE a SYSTEM'B"
+    output = [["DOCTYPE", "a", nil, "B", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'Y" do
+    input = "<!DOCTYPE a SYSTEM'Y"
+    output = [["DOCTYPE", "a", nil, "Y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'Z" do
+    input = "<!DOCTYPE a SYSTEM'Z"
+    output = [["DOCTYPE", "a", nil, "Z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 39, 0>>
+    output = [["DOCTYPE", "a", nil, "�", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\\u0009" do
+    input = "<!DOCTYPE a SYSTEM'\t"
+    output = [["DOCTYPE", "a", nil, "\t", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\\u000A" do
+    input = "<!DOCTYPE a SYSTEM'\n"
+    output = [["DOCTYPE", "a", nil, "\n", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\\u000B" do
+    input = "<!DOCTYPE a SYSTEM'\v"
+    output = [["DOCTYPE", "a", nil, "\v", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\\u000C" do
+    input = "<!DOCTYPE a SYSTEM'\f"
+    output = [["DOCTYPE", "a", nil, "\f", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a SYSTEM'􀀀"
+    output = [["DOCTYPE", "a", nil, "􀀀", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'`" do
+    input = "<!DOCTYPE a SYSTEM'`"
+    output = [["DOCTYPE", "a", nil, "`", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'a" do
+    input = "<!DOCTYPE a SYSTEM'a"
+    output = [["DOCTYPE", "a", nil, "a", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'b" do
+    input = "<!DOCTYPE a SYSTEM'b"
+    output = [["DOCTYPE", "a", nil, "b", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'y" do
+    input = "<!DOCTYPE a SYSTEM'y"
+    output = [["DOCTYPE", "a", nil, "y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'z" do
+    input = "<!DOCTYPE a SYSTEM'z"
+    output = [["DOCTYPE", "a", nil, "z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM'{" do
+    input = "<!DOCTYPE a SYSTEM'{"
+    output = [["DOCTYPE", "a", nil, "{", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM(" do
+    input = "<!DOCTYPE a SYSTEM("
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM-" do
+    input = "<!DOCTYPE a SYSTEM-"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM/" do
+    input = "<!DOCTYPE a SYSTEM/"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM0" do
+    input = "<!DOCTYPE a SYSTEM0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM1" do
+    input = "<!DOCTYPE a SYSTEM1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM9" do
+    input = "<!DOCTYPE a SYSTEM9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM<" do
+    input = "<!DOCTYPE a SYSTEM<"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM=" do
+    input = "<!DOCTYPE a SYSTEM="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM>" do
+    input = "<!DOCTYPE a SYSTEM>"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM?" do
+    input = "<!DOCTYPE a SYSTEM?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM@" do
+    input = "<!DOCTYPE a SYSTEM@"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMA" do
+    input = "<!DOCTYPE a SYSTEMA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMB" do
+    input = "<!DOCTYPE a SYSTEMB"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMY" do
+    input = "<!DOCTYPE a SYSTEMY"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMZ" do
+    input = "<!DOCTYPE a SYSTEMZ"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u0008" do
+    input = "<!DOCTYPE a SYSTEM\b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u0009" do
+    input = "<!DOCTYPE a SYSTEM\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u000A" do
+    input = "<!DOCTYPE a SYSTEM\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u000B" do
+    input = "<!DOCTYPE a SYSTEM\v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u000C" do
+    input = "<!DOCTYPE a SYSTEM\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u000D" do
+    input = "<!DOCTYPE a SYSTEM\r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 83, 89, 83, 84, 69, 77, 31>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a SYSTEM􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM`" do
+    input = "<!DOCTYPE a SYSTEM`"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMa" do
+    input = "<!DOCTYPE a SYSTEMa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMb" do
+    input = "<!DOCTYPE a SYSTEMb"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMy" do
+    input = "<!DOCTYPE a SYSTEMy"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEMz" do
+    input = "<!DOCTYPE a SYSTEMz"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a SYSTEM{" do
+    input = "<!DOCTYPE a SYSTEM{"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a Y" do
+    input = "<!DOCTYPE a Y"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a Z" do
+    input = "<!DOCTYPE a Z"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u0008" do
+    input = "<!DOCTYPE a \b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u0009" do
+    input = "<!DOCTYPE a \t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u000A" do
+    input = "<!DOCTYPE a \n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u000B" do
+    input = "<!DOCTYPE a \v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u000C" do
+    input = "<!DOCTYPE a \f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u000D" do
+    input = "<!DOCTYPE a \r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 31>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a \\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a 􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a `" do
+    input = "<!DOCTYPE a `"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a" do
+    input = "<!DOCTYPE a a"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a " do
+    input = "<!DOCTYPE a a "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a!" do
+    input = "<!DOCTYPE a a!"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\"" do
+    input = "<!DOCTYPE a a\""
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a&" do
+    input = "<!DOCTYPE a a&"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a'" do
+    input = "<!DOCTYPE a a'"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a-" do
+    input = "<!DOCTYPE a a-"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a/" do
+    input = "<!DOCTYPE a a/"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a0" do
+    input = "<!DOCTYPE a a0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a1" do
+    input = "<!DOCTYPE a a1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a9" do
+    input = "<!DOCTYPE a a9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a<" do
+    input = "<!DOCTYPE a a<"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a=" do
+    input = "<!DOCTYPE a a="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a>" do
+    input = "<!DOCTYPE a a>"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a?" do
+    input = "<!DOCTYPE a a?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a@" do
+    input = "<!DOCTYPE a a@"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a aA" do
+    input = "<!DOCTYPE a aA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a aB" do
+    input = "<!DOCTYPE a aB"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a aY" do
+    input = "<!DOCTYPE a aY"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a aZ" do
+    input = "<!DOCTYPE a aZ"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 32, 97, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\\u0009" do
+    input = "<!DOCTYPE a a\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\\u000A" do
+    input = "<!DOCTYPE a a\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\\u000B" do
+    input = "<!DOCTYPE a a\v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\\u000C" do
+    input = "<!DOCTYPE a a\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a a􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a`" do
+    input = "<!DOCTYPE a a`"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a aa" do
+    input = "<!DOCTYPE a aa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a ab" do
+    input = "<!DOCTYPE a ab"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a ay" do
+    input = "<!DOCTYPE a ay"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a az" do
+    input = "<!DOCTYPE a az"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a a{" do
+    input = "<!DOCTYPE a a{"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a b" do
+    input = "<!DOCTYPE a b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a y" do
+    input = "<!DOCTYPE a y"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a z" do
+    input = "<!DOCTYPE a z"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a {" do
+    input = "<!DOCTYPE a {"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a!" do
+    input = "<!DOCTYPE a!"
+    output = [["DOCTYPE", "a!", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\"" do
+    input = "<!DOCTYPE a\""
+    output = [["DOCTYPE", "a\"", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a&" do
+    input = "<!DOCTYPE a&"
+    output = [["DOCTYPE", "a&", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part7_test.exs b/test/floki/html/generated/tokenizer/test3_part7_test.exs
new file mode 100644
index 00000000..814c224b
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part7_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part7Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPE a'" do
+    input = "<!DOCTYPE a'"
+    output = [["DOCTYPE", "a'", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a-" do
+    input = "<!DOCTYPE a-"
+    output = [["DOCTYPE", "a-", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a/" do
+    input = "<!DOCTYPE a/"
+    output = [["DOCTYPE", "a/", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a0" do
+    input = "<!DOCTYPE a0"
+    output = [["DOCTYPE", "a0", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a1" do
+    input = "<!DOCTYPE a1"
+    output = [["DOCTYPE", "a1", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a9" do
+    input = "<!DOCTYPE a9"
+    output = [["DOCTYPE", "a9", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a<" do
+    input = "<!DOCTYPE a<"
+    output = [["DOCTYPE", "a<", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a=" do
+    input = "<!DOCTYPE a="
+    output = [["DOCTYPE", "a=", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a>" do
+    input = "<!DOCTYPE a>"
+    output = [["DOCTYPE", "a", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a?" do
+    input = "<!DOCTYPE a?"
+    output = [["DOCTYPE", "a?", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a@" do
+    input = "<!DOCTYPE a@"
+    output = [["DOCTYPE", "a@", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE aA" do
+    input = "<!DOCTYPE aA"
+    output = [["DOCTYPE", "aa", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE aB" do
+    input = "<!DOCTYPE aB"
+    output = [["DOCTYPE", "ab", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE aY" do
+    input = "<!DOCTYPE aY"
+    output = [["DOCTYPE", "ay", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE aZ" do
+    input = "<!DOCTYPE aZ"
+    output = [["DOCTYPE", "az", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a[" do
+    input = "<!DOCTYPE a["
+    output = [["DOCTYPE", "a[", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 0>>
+    output = [["DOCTYPE", "a�", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u0008" do
+    input = "<!DOCTYPE a\b"
+    output = [["DOCTYPE", "a\b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u0009" do
+    input = "<!DOCTYPE a\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u000A" do
+    input = "<!DOCTYPE a\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u000B" do
+    input = "<!DOCTYPE a\v"
+    output = [["DOCTYPE", "a\v", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u000C" do
+    input = "<!DOCTYPE a\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u000D" do
+    input = "<!DOCTYPE a\r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 32, 97, 31>>
+    output = [["DOCTYPE", <<97, 31>>, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE a􀀀"
+    output = [["DOCTYPE", "a􀀀", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a`" do
+    input = "<!DOCTYPE a`"
+    output = [["DOCTYPE", "a`", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE aa" do
+    input = "<!DOCTYPE aa"
+    output = [["DOCTYPE", "aa", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE ab" do
+    input = "<!DOCTYPE ab"
+    output = [["DOCTYPE", "ab", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE ay" do
+    input = "<!DOCTYPE ay"
+    output = [["DOCTYPE", "ay", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE az" do
+    input = "<!DOCTYPE az"
+    output = [["DOCTYPE", "az", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE a{" do
+    input = "<!DOCTYPE a{"
+    output = [["DOCTYPE", "a{", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE b" do
+    input = "<!DOCTYPE b"
+    output = [["DOCTYPE", "b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE y" do
+    input = "<!DOCTYPE y"
+    output = [["DOCTYPE", "y", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE z" do
+    input = "<!DOCTYPE z"
+    output = [["DOCTYPE", "z", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE {" do
+    input = "<!DOCTYPE {"
+    output = [["DOCTYPE", "{", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE!" do
+    input = "<!DOCTYPE!"
+    output = [["DOCTYPE", "!", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\"" do
+    input = "<!DOCTYPE\""
+    output = [["DOCTYPE", "\"", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE&" do
+    input = "<!DOCTYPE&"
+    output = [["DOCTYPE", "&", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE'" do
+    input = "<!DOCTYPE'"
+    output = [["DOCTYPE", "'", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE-" do
+    input = "<!DOCTYPE-"
+    output = [["DOCTYPE", "-", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE/" do
+    input = "<!DOCTYPE/"
+    output = [["DOCTYPE", "/", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE0" do
+    input = "<!DOCTYPE0"
+    output = [["DOCTYPE", "0", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE1" do
+    input = "<!DOCTYPE1"
+    output = [["DOCTYPE", "1", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE9" do
+    input = "<!DOCTYPE9"
+    output = [["DOCTYPE", "9", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE<" do
+    input = "<!DOCTYPE<"
+    output = [["DOCTYPE", "<", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE=" do
+    input = "<!DOCTYPE="
+    output = [["DOCTYPE", "=", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE>" do
+    input = "<!DOCTYPE>"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE?" do
+    input = "<!DOCTYPE?"
+    output = [["DOCTYPE", "?", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE@" do
+    input = "<!DOCTYPE@"
+    output = [["DOCTYPE", "@", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEA" do
+    input = "<!DOCTYPEA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEB" do
+    input = "<!DOCTYPEB"
+    output = [["DOCTYPE", "b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEY" do
+    input = "<!DOCTYPEY"
+    output = [["DOCTYPE", "y", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEZ" do
+    input = "<!DOCTYPEZ"
+    output = [["DOCTYPE", "z", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 0>>
+    output = [["DOCTYPE", "�", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u0008" do
+    input = "<!DOCTYPE\b"
+    output = [["DOCTYPE", "\b", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u0009" do
+    input = "<!DOCTYPE\t"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u000A" do
+    input = "<!DOCTYPE\n"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u000B" do
+    input = "<!DOCTYPE\v"
+    output = [["DOCTYPE", "\v", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u000C" do
+    input = "<!DOCTYPE\f"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u000D" do
+    input = "<!DOCTYPE\r"
+    output = [["DOCTYPE", nil, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 31>>
+    output = [["DOCTYPE", <<31>>, nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE\\uDBC0\\uDC00" do
+    input = "<!DOCTYPE􀀀"
+    output = [["DOCTYPE", "􀀀", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPE`" do
+    input = "<!DOCTYPE`"
+    output = [["DOCTYPE", "`", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa" do
+    input = "<!DOCTYPEa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa " do
+    input = "<!DOCTYPEa "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa  " do
+    input = "<!DOCTYPEa  "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa !" do
+    input = "<!DOCTYPEa !"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa \"" do
+    input = "<!DOCTYPEa \""
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa &" do
+    input = "<!DOCTYPEa &"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa '" do
+    input = "<!DOCTYPEa '"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa -" do
+    input = "<!DOCTYPEa -"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa /" do
+    input = "<!DOCTYPEa /"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa 0" do
+    input = "<!DOCTYPEa 0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa 1" do
+    input = "<!DOCTYPEa 1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa 9" do
+    input = "<!DOCTYPEa 9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa <" do
+    input = "<!DOCTYPEa <"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa =" do
+    input = "<!DOCTYPEa ="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa >" do
+    input = "<!DOCTYPEa >"
+    output = [["DOCTYPE", "a", nil, nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa ?" do
+    input = "<!DOCTYPEa ?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa @" do
+    input = "<!DOCTYPEa @"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa A" do
+    input = "<!DOCTYPEa A"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa B" do
+    input = "<!DOCTYPEa B"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC" do
+    input = "<!DOCTYPEa PUBLIC"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC " do
+    input = "<!DOCTYPEa PUBLIC "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC!" do
+    input = "<!DOCTYPEa PUBLIC!"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"" do
+    input = "<!DOCTYPEa PUBLIC\""
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\" " do
+    input = "<!DOCTYPEa PUBLIC\" "
+    output = [["DOCTYPE", "a", " ", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"!" do
+    input = "<!DOCTYPEa PUBLIC\"!"
+    output = [["DOCTYPE", "a", "!", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\"" do
+    input = "<!DOCTYPEa PUBLIC\"\""
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"#" do
+    input = "<!DOCTYPEa PUBLIC\"#"
+    output = [["DOCTYPE", "a", "#", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"&" do
+    input = "<!DOCTYPEa PUBLIC\"&"
+    output = [["DOCTYPE", "a", "&", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"'" do
+    input = "<!DOCTYPEa PUBLIC\"'"
+    output = [["DOCTYPE", "a", "'", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"-" do
+    input = "<!DOCTYPEa PUBLIC\"-"
+    output = [["DOCTYPE", "a", "-", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"/" do
+    input = "<!DOCTYPEa PUBLIC\"/"
+    output = [["DOCTYPE", "a", "/", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"0" do
+    input = "<!DOCTYPEa PUBLIC\"0"
+    output = [["DOCTYPE", "a", "0", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"1" do
+    input = "<!DOCTYPEa PUBLIC\"1"
+    output = [["DOCTYPE", "a", "1", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"9" do
+    input = "<!DOCTYPEa PUBLIC\"9"
+    output = [["DOCTYPE", "a", "9", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"<" do
+    input = "<!DOCTYPEa PUBLIC\"<"
+    output = [["DOCTYPE", "a", "<", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"=" do
+    input = "<!DOCTYPEa PUBLIC\"="
+    output = [["DOCTYPE", "a", "=", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\">" do
+    input = "<!DOCTYPEa PUBLIC\">"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part8_test.exs b/test/floki/html/generated/tokenizer/test3_part8_test.exs
new file mode 100644
index 00000000..f616800c
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part8_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part8Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"?" do
+    input = "<!DOCTYPEa PUBLIC\"?"
+    output = [["DOCTYPE", "a", "?", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"@" do
+    input = "<!DOCTYPEa PUBLIC\"@"
+    output = [["DOCTYPE", "a", "@", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"A" do
+    input = "<!DOCTYPEa PUBLIC\"A"
+    output = [["DOCTYPE", "a", "A", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"B" do
+    input = "<!DOCTYPEa PUBLIC\"B"
+    output = [["DOCTYPE", "a", "B", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"Y" do
+    input = "<!DOCTYPEa PUBLIC\"Y"
+    output = [["DOCTYPE", "a", "Y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"Z" do
+    input = "<!DOCTYPEa PUBLIC\"Z"
+    output = [["DOCTYPE", "a", "Z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 80, 85, 66, 76, 73, 67, 34, 0>>
+    output = [["DOCTYPE", "a", "�", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\\u0009" do
+    input = "<!DOCTYPEa PUBLIC\"\t"
+    output = [["DOCTYPE", "a", "\t", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\\u000A" do
+    input = "<!DOCTYPEa PUBLIC\"\n"
+    output = [["DOCTYPE", "a", "\n", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\\u000B" do
+    input = "<!DOCTYPEa PUBLIC\"\v"
+    output = [["DOCTYPE", "a", "\v", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\\u000C" do
+    input = "<!DOCTYPEa PUBLIC\"\f"
+    output = [["DOCTYPE", "a", "\f", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa PUBLIC\"􀀀"
+    output = [["DOCTYPE", "a", "􀀀", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"`" do
+    input = "<!DOCTYPEa PUBLIC\"`"
+    output = [["DOCTYPE", "a", "`", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"a" do
+    input = "<!DOCTYPEa PUBLIC\"a"
+    output = [["DOCTYPE", "a", "a", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"b" do
+    input = "<!DOCTYPEa PUBLIC\"b"
+    output = [["DOCTYPE", "a", "b", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"y" do
+    input = "<!DOCTYPEa PUBLIC\"y"
+    output = [["DOCTYPE", "a", "y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"z" do
+    input = "<!DOCTYPEa PUBLIC\"z"
+    output = [["DOCTYPE", "a", "z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\"{" do
+    input = "<!DOCTYPEa PUBLIC\"{"
+    output = [["DOCTYPE", "a", "{", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC#" do
+    input = "<!DOCTYPEa PUBLIC#"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC&" do
+    input = "<!DOCTYPEa PUBLIC&"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'" do
+    input = "<!DOCTYPEa PUBLIC'"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC' " do
+    input = "<!DOCTYPEa PUBLIC' "
+    output = [["DOCTYPE", "a", " ", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'!" do
+    input = "<!DOCTYPEa PUBLIC'!"
+    output = [["DOCTYPE", "a", "!", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\"" do
+    input = "<!DOCTYPEa PUBLIC'\""
+    output = [["DOCTYPE", "a", "\"", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'&" do
+    input = "<!DOCTYPEa PUBLIC'&"
+    output = [["DOCTYPE", "a", "&", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''" do
+    input = "<!DOCTYPEa PUBLIC''"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'' " do
+    input = "<!DOCTYPEa PUBLIC'' "
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''!" do
+    input = "<!DOCTYPEa PUBLIC''!"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\"" do
+    input = "<!DOCTYPEa PUBLIC''\""
+    output = [["DOCTYPE", "a", "", "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''#" do
+    input = "<!DOCTYPEa PUBLIC''#"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''&" do
+    input = "<!DOCTYPEa PUBLIC''&"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'''" do
+    input = "<!DOCTYPEa PUBLIC'''"
+    output = [["DOCTYPE", "a", "", "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''(" do
+    input = "<!DOCTYPEa PUBLIC''("
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''-" do
+    input = "<!DOCTYPEa PUBLIC''-"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''/" do
+    input = "<!DOCTYPEa PUBLIC''/"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''0" do
+    input = "<!DOCTYPEa PUBLIC''0"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''1" do
+    input = "<!DOCTYPEa PUBLIC''1"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''9" do
+    input = "<!DOCTYPEa PUBLIC''9"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''<" do
+    input = "<!DOCTYPEa PUBLIC''<"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''=" do
+    input = "<!DOCTYPEa PUBLIC''="
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''>" do
+    input = "<!DOCTYPEa PUBLIC''>"
+    output = [["DOCTYPE", "a", "", nil, true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''?" do
+    input = "<!DOCTYPEa PUBLIC''?"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''@" do
+    input = "<!DOCTYPEa PUBLIC''@"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''A" do
+    input = "<!DOCTYPEa PUBLIC''A"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''B" do
+    input = "<!DOCTYPEa PUBLIC''B"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''Y" do
+    input = "<!DOCTYPEa PUBLIC''Y"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''Z" do
+    input = "<!DOCTYPEa PUBLIC''Z"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 0>>
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u0008" do
+    input = "<!DOCTYPEa PUBLIC''\b"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u0009" do
+    input = "<!DOCTYPEa PUBLIC''\t"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u000A" do
+    input = "<!DOCTYPEa PUBLIC''\n"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u000B" do
+    input = "<!DOCTYPEa PUBLIC''\v"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u000C" do
+    input = "<!DOCTYPEa PUBLIC''\f"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u000D" do
+    input = "<!DOCTYPEa PUBLIC''\r"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 80, 85, 66, 76, 73, 67, 39, 39, 31>>
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa PUBLIC''􀀀"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''`" do
+    input = "<!DOCTYPEa PUBLIC''`"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''a" do
+    input = "<!DOCTYPEa PUBLIC''a"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''b" do
+    input = "<!DOCTYPEa PUBLIC''b"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''y" do
+    input = "<!DOCTYPEa PUBLIC''y"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''z" do
+    input = "<!DOCTYPEa PUBLIC''z"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC''{" do
+    input = "<!DOCTYPEa PUBLIC''{"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'(" do
+    input = "<!DOCTYPEa PUBLIC'("
+    output = [["DOCTYPE", "a", "(", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'-" do
+    input = "<!DOCTYPEa PUBLIC'-"
+    output = [["DOCTYPE", "a", "-", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'/" do
+    input = "<!DOCTYPEa PUBLIC'/"
+    output = [["DOCTYPE", "a", "/", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'0" do
+    input = "<!DOCTYPEa PUBLIC'0"
+    output = [["DOCTYPE", "a", "0", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'1" do
+    input = "<!DOCTYPEa PUBLIC'1"
+    output = [["DOCTYPE", "a", "1", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'9" do
+    input = "<!DOCTYPEa PUBLIC'9"
+    output = [["DOCTYPE", "a", "9", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'<" do
+    input = "<!DOCTYPEa PUBLIC'<"
+    output = [["DOCTYPE", "a", "<", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'=" do
+    input = "<!DOCTYPEa PUBLIC'="
+    output = [["DOCTYPE", "a", "=", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'>" do
+    input = "<!DOCTYPEa PUBLIC'>"
+    output = [["DOCTYPE", "a", "", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'?" do
+    input = "<!DOCTYPEa PUBLIC'?"
+    output = [["DOCTYPE", "a", "?", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'@" do
+    input = "<!DOCTYPEa PUBLIC'@"
+    output = [["DOCTYPE", "a", "@", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'A" do
+    input = "<!DOCTYPEa PUBLIC'A"
+    output = [["DOCTYPE", "a", "A", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'B" do
+    input = "<!DOCTYPEa PUBLIC'B"
+    output = [["DOCTYPE", "a", "B", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'Y" do
+    input = "<!DOCTYPEa PUBLIC'Y"
+    output = [["DOCTYPE", "a", "Y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'Z" do
+    input = "<!DOCTYPEa PUBLIC'Z"
+    output = [["DOCTYPE", "a", "Z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 80, 85, 66, 76, 73, 67, 39, 0>>
+    output = [["DOCTYPE", "a", "�", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\\u0009" do
+    input = "<!DOCTYPEa PUBLIC'\t"
+    output = [["DOCTYPE", "a", "\t", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\\u000A" do
+    input = "<!DOCTYPEa PUBLIC'\n"
+    output = [["DOCTYPE", "a", "\n", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\\u000B" do
+    input = "<!DOCTYPEa PUBLIC'\v"
+    output = [["DOCTYPE", "a", "\v", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\\u000C" do
+    input = "<!DOCTYPEa PUBLIC'\f"
+    output = [["DOCTYPE", "a", "\f", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa PUBLIC'􀀀"
+    output = [["DOCTYPE", "a", "􀀀", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'`" do
+    input = "<!DOCTYPEa PUBLIC'`"
+    output = [["DOCTYPE", "a", "`", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'a" do
+    input = "<!DOCTYPEa PUBLIC'a"
+    output = [["DOCTYPE", "a", "a", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'b" do
+    input = "<!DOCTYPEa PUBLIC'b"
+    output = [["DOCTYPE", "a", "b", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'y" do
+    input = "<!DOCTYPEa PUBLIC'y"
+    output = [["DOCTYPE", "a", "y", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'z" do
+    input = "<!DOCTYPEa PUBLIC'z"
+    output = [["DOCTYPE", "a", "z", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC'{" do
+    input = "<!DOCTYPEa PUBLIC'{"
+    output = [["DOCTYPE", "a", "{", nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC(" do
+    input = "<!DOCTYPEa PUBLIC("
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC-" do
+    input = "<!DOCTYPEa PUBLIC-"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC/" do
+    input = "<!DOCTYPEa PUBLIC/"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC0" do
+    input = "<!DOCTYPEa PUBLIC0"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC1" do
+    input = "<!DOCTYPEa PUBLIC1"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC9" do
+    input = "<!DOCTYPEa PUBLIC9"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC<" do
+    input = "<!DOCTYPEa PUBLIC<"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC=" do
+    input = "<!DOCTYPEa PUBLIC="
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC>" do
+    input = "<!DOCTYPEa PUBLIC>"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC?" do
+    input = "<!DOCTYPEa PUBLIC?"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC@" do
+    input = "<!DOCTYPEa PUBLIC@"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/test3_part9_test.exs b/test/floki/html/generated/tokenizer/test3_part9_test.exs
new file mode 100644
index 00000000..801a119c
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/test3_part9_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.Test3Part9Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests test3.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 <!DOCTYPEa PUBLICA" do
+    input = "<!DOCTYPEa PUBLICA"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICB" do
+    input = "<!DOCTYPEa PUBLICB"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICY" do
+    input = "<!DOCTYPEa PUBLICY"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICZ" do
+    input = "<!DOCTYPEa PUBLICZ"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 80, 85, 66, 76, 73, 67, 0>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u0008" do
+    input = "<!DOCTYPEa PUBLIC\b"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u0009" do
+    input = "<!DOCTYPEa PUBLIC\t"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u000A" do
+    input = "<!DOCTYPEa PUBLIC\n"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u000B" do
+    input = "<!DOCTYPEa PUBLIC\v"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u000C" do
+    input = "<!DOCTYPEa PUBLIC\f"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u000D" do
+    input = "<!DOCTYPEa PUBLIC\r"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 80, 85, 66, 76, 73, 67, 31>>
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa PUBLIC􀀀"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC`" do
+    input = "<!DOCTYPEa PUBLIC`"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICa" do
+    input = "<!DOCTYPEa PUBLICa"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICb" do
+    input = "<!DOCTYPEa PUBLICb"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICy" do
+    input = "<!DOCTYPEa PUBLICy"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLICz" do
+    input = "<!DOCTYPEa PUBLICz"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa PUBLIC{" do
+    input = "<!DOCTYPEa PUBLIC{"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM" do
+    input = "<!DOCTYPEa SYSTEM"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM " do
+    input = "<!DOCTYPEa SYSTEM "
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM!" do
+    input = "<!DOCTYPEa SYSTEM!"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"" do
+    input = "<!DOCTYPEa SYSTEM\""
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\" " do
+    input = "<!DOCTYPEa SYSTEM\" "
+    output = [["DOCTYPE", "a", nil, " ", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"!" do
+    input = "<!DOCTYPEa SYSTEM\"!"
+    output = [["DOCTYPE", "a", nil, "!", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\"" do
+    input = "<!DOCTYPEa SYSTEM\"\""
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"#" do
+    input = "<!DOCTYPEa SYSTEM\"#"
+    output = [["DOCTYPE", "a", nil, "#", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"&" do
+    input = "<!DOCTYPEa SYSTEM\"&"
+    output = [["DOCTYPE", "a", nil, "&", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"'" do
+    input = "<!DOCTYPEa SYSTEM\"'"
+    output = [["DOCTYPE", "a", nil, "'", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"-" do
+    input = "<!DOCTYPEa SYSTEM\"-"
+    output = [["DOCTYPE", "a", nil, "-", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"/" do
+    input = "<!DOCTYPEa SYSTEM\"/"
+    output = [["DOCTYPE", "a", nil, "/", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"0" do
+    input = "<!DOCTYPEa SYSTEM\"0"
+    output = [["DOCTYPE", "a", nil, "0", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"1" do
+    input = "<!DOCTYPEa SYSTEM\"1"
+    output = [["DOCTYPE", "a", nil, "1", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"9" do
+    input = "<!DOCTYPEa SYSTEM\"9"
+    output = [["DOCTYPE", "a", nil, "9", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"<" do
+    input = "<!DOCTYPEa SYSTEM\"<"
+    output = [["DOCTYPE", "a", nil, "<", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"=" do
+    input = "<!DOCTYPEa SYSTEM\"="
+    output = [["DOCTYPE", "a", nil, "=", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\">" do
+    input = "<!DOCTYPEa SYSTEM\">"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"?" do
+    input = "<!DOCTYPEa SYSTEM\"?"
+    output = [["DOCTYPE", "a", nil, "?", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"@" do
+    input = "<!DOCTYPEa SYSTEM\"@"
+    output = [["DOCTYPE", "a", nil, "@", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"A" do
+    input = "<!DOCTYPEa SYSTEM\"A"
+    output = [["DOCTYPE", "a", nil, "A", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"B" do
+    input = "<!DOCTYPEa SYSTEM\"B"
+    output = [["DOCTYPE", "a", nil, "B", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"Y" do
+    input = "<!DOCTYPEa SYSTEM\"Y"
+    output = [["DOCTYPE", "a", nil, "Y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"Z" do
+    input = "<!DOCTYPEa SYSTEM\"Z"
+    output = [["DOCTYPE", "a", nil, "Z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 83, 89, 83, 84, 69, 77, 34, 0>>
+    output = [["DOCTYPE", "a", nil, "�", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\\u0009" do
+    input = "<!DOCTYPEa SYSTEM\"\t"
+    output = [["DOCTYPE", "a", nil, "\t", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\\u000A" do
+    input = "<!DOCTYPEa SYSTEM\"\n"
+    output = [["DOCTYPE", "a", nil, "\n", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\\u000B" do
+    input = "<!DOCTYPEa SYSTEM\"\v"
+    output = [["DOCTYPE", "a", nil, "\v", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\\u000C" do
+    input = "<!DOCTYPEa SYSTEM\"\f"
+    output = [["DOCTYPE", "a", nil, "\f", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa SYSTEM\"􀀀"
+    output = [["DOCTYPE", "a", nil, "􀀀", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"`" do
+    input = "<!DOCTYPEa SYSTEM\"`"
+    output = [["DOCTYPE", "a", nil, "`", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"a" do
+    input = "<!DOCTYPEa SYSTEM\"a"
+    output = [["DOCTYPE", "a", nil, "a", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"b" do
+    input = "<!DOCTYPEa SYSTEM\"b"
+    output = [["DOCTYPE", "a", nil, "b", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"y" do
+    input = "<!DOCTYPEa SYSTEM\"y"
+    output = [["DOCTYPE", "a", nil, "y", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"z" do
+    input = "<!DOCTYPEa SYSTEM\"z"
+    output = [["DOCTYPE", "a", nil, "z", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM\"{" do
+    input = "<!DOCTYPEa SYSTEM\"{"
+    output = [["DOCTYPE", "a", nil, "{", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM#" do
+    input = "<!DOCTYPEa SYSTEM#"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM&" do
+    input = "<!DOCTYPEa SYSTEM&"
+    output = [["DOCTYPE", "a", nil, nil, false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'" do
+    input = "<!DOCTYPEa SYSTEM'"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM' " do
+    input = "<!DOCTYPEa SYSTEM' "
+    output = [["DOCTYPE", "a", nil, " ", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'!" do
+    input = "<!DOCTYPEa SYSTEM'!"
+    output = [["DOCTYPE", "a", nil, "!", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'\"" do
+    input = "<!DOCTYPEa SYSTEM'\""
+    output = [["DOCTYPE", "a", nil, "\"", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'&" do
+    input = "<!DOCTYPEa SYSTEM'&"
+    output = [["DOCTYPE", "a", nil, "&", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''" do
+    input = "<!DOCTYPEa SYSTEM''"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'' " do
+    input = "<!DOCTYPEa SYSTEM'' "
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''!" do
+    input = "<!DOCTYPEa SYSTEM''!"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\"" do
+    input = "<!DOCTYPEa SYSTEM''\""
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''&" do
+    input = "<!DOCTYPEa SYSTEM''&"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'''" do
+    input = "<!DOCTYPEa SYSTEM'''"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''-" do
+    input = "<!DOCTYPEa SYSTEM''-"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''/" do
+    input = "<!DOCTYPEa SYSTEM''/"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''0" do
+    input = "<!DOCTYPEa SYSTEM''0"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''1" do
+    input = "<!DOCTYPEa SYSTEM''1"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''9" do
+    input = "<!DOCTYPEa SYSTEM''9"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''<" do
+    input = "<!DOCTYPEa SYSTEM''<"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''=" do
+    input = "<!DOCTYPEa SYSTEM''="
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''>" do
+    input = "<!DOCTYPEa SYSTEM''>"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''?" do
+    input = "<!DOCTYPEa SYSTEM''?"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''@" do
+    input = "<!DOCTYPEa SYSTEM''@"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''A" do
+    input = "<!DOCTYPEa SYSTEM''A"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''B" do
+    input = "<!DOCTYPEa SYSTEM''B"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''Y" do
+    input = "<!DOCTYPEa SYSTEM''Y"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''Z" do
+    input = "<!DOCTYPEa SYSTEM''Z"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u0000" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 83, 89, 83, 84, 69, 77, 39, 39, 0>>
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u0008" do
+    input = "<!DOCTYPEa SYSTEM''\b"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u0009" do
+    input = "<!DOCTYPEa SYSTEM''\t"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u000A" do
+    input = "<!DOCTYPEa SYSTEM''\n"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u000B" do
+    input = "<!DOCTYPEa SYSTEM''\v"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u000C" do
+    input = "<!DOCTYPEa SYSTEM''\f"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u000D" do
+    input = "<!DOCTYPEa SYSTEM''\r"
+    output = [["DOCTYPE", "a", nil, "", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\u001F" do
+    input = <<60, 33, 68, 79, 67, 84, 89, 80, 69, 97, 32, 83, 89, 83, 84, 69, 77, 39, 39, 31>>
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''\\uDBC0\\uDC00" do
+    input = "<!DOCTYPEa SYSTEM''􀀀"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''`" do
+    input = "<!DOCTYPEa SYSTEM''`"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''a" do
+    input = "<!DOCTYPEa SYSTEM''a"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''b" do
+    input = "<!DOCTYPEa SYSTEM''b"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''y" do
+    input = "<!DOCTYPEa SYSTEM''y"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''z" do
+    input = "<!DOCTYPEa SYSTEM''z"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM''{" do
+    input = "<!DOCTYPEa SYSTEM''{"
+    output = [["DOCTYPE", "a", nil, "", true]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'(" do
+    input = "<!DOCTYPEa SYSTEM'("
+    output = [["DOCTYPE", "a", nil, "(", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'-" do
+    input = "<!DOCTYPEa SYSTEM'-"
+    output = [["DOCTYPE", "a", nil, "-", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 <!DOCTYPEa SYSTEM'/" do
+    input = "<!DOCTYPEa SYSTEM'/"
+    output = [["DOCTYPE", "a", nil, "/", false]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/unicodeCharsProblematic_test.exs b/test/floki/html/generated/tokenizer/unicodeCharsProblematic_test.exs
new file mode 100644
index 00000000..0ea5d6e2
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/unicodeCharsProblematic_test.exs
@@ -0,0 +1,68 @@
+defmodule Floki.HTML.Generated.Tokenizer.UnicodecharsproblematicTest do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests unicodeCharsProblematic.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 CR followed by U+0000" do
+    input = <<13, 0>>
+    output = [["Character", <<10, 0>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+D800" do
+    input = "\\uD800"
+    output = [["Character", "\\uD800"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+D800 with valid following character" do
+    input = "\\uD800a"
+    output = [["Character", "\\uD800a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+DFFF" do
+    input = "\\uDFFF"
+    output = [["Character", "\\uDFFF"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+DFFF with valid preceding character" do
+    input = "a\\uDFFF"
+    output = [["Character", "a\\uDFFF"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/unicodeChars_part1_test.exs b/test/floki/html/generated/tokenizer/unicodeChars_part1_test.exs
new file mode 100644
index 00000000..f70eed11
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/unicodeChars_part1_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.UnicodecharsPart1Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests unicodeChars.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Invalid Unicode character U+0001" do
+    input = <<1>>
+    output = [["Character", <<1>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0002" do
+    input = <<2>>
+    output = [["Character", <<2>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0003" do
+    input = <<3>>
+    output = [["Character", <<3>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0004" do
+    input = <<4>>
+    output = [["Character", <<4>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0005" do
+    input = <<5>>
+    output = [["Character", <<5>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0006" do
+    input = <<6>>
+    output = [["Character", <<6>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0007" do
+    input = "\a"
+    output = [["Character", "\a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0008" do
+    input = "\b"
+    output = [["Character", "\b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+000B" do
+    input = "\v"
+    output = [["Character", "\v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+000E" do
+    input = <<14>>
+    output = [["Character", <<14>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+000F" do
+    input = <<15>>
+    output = [["Character", <<15>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0010" do
+    input = <<16>>
+    output = [["Character", <<16>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0011" do
+    input = <<17>>
+    output = [["Character", <<17>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0012" do
+    input = <<18>>
+    output = [["Character", <<18>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0013" do
+    input = <<19>>
+    output = [["Character", <<19>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0014" do
+    input = <<20>>
+    output = [["Character", <<20>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0015" do
+    input = <<21>>
+    output = [["Character", <<21>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0016" do
+    input = <<22>>
+    output = [["Character", <<22>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0017" do
+    input = <<23>>
+    output = [["Character", <<23>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0018" do
+    input = <<24>>
+    output = [["Character", <<24>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+0019" do
+    input = <<25>>
+    output = [["Character", <<25>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+001A" do
+    input = <<26>>
+    output = [["Character", <<26>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+001B" do
+    input = "\e"
+    output = [["Character", "\e"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+001C" do
+    input = <<28>>
+    output = [["Character", <<28>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+001D" do
+    input = <<29>>
+    output = [["Character", <<29>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+001E" do
+    input = <<30>>
+    output = [["Character", <<30>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+001F" do
+    input = <<31>>
+    output = [["Character", <<31>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+007F" do
+    input = "\d"
+    output = [["Character", "\d"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+10FFFE" do
+    input = "􏿾"
+    output = [["Character", "􏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+10FFFF" do
+    input = "􏿿"
+    output = [["Character", "􏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+1FFFE" do
+    input = "🿾"
+    output = [["Character", "🿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+1FFFF" do
+    input = "🿿"
+    output = [["Character", "🿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+2FFFE" do
+    input = "𯿾"
+    output = [["Character", "𯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+2FFFF" do
+    input = "𯿿"
+    output = [["Character", "𯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+3FFFE" do
+    input = "𿿾"
+    output = [["Character", "𿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+3FFFF" do
+    input = "𿿿"
+    output = [["Character", "𿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+4FFFE" do
+    input = "񏿾"
+    output = [["Character", "񏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+4FFFF" do
+    input = "񏿿"
+    output = [["Character", "񏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+5FFFE" do
+    input = "񟿾"
+    output = [["Character", "񟿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+5FFFF" do
+    input = "񟿿"
+    output = [["Character", "񟿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+6FFFE" do
+    input = "񯿾"
+    output = [["Character", "񯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+6FFFF" do
+    input = "񯿿"
+    output = [["Character", "񯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+7FFFE" do
+    input = "񿿾"
+    output = [["Character", "񿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+7FFFF" do
+    input = "񿿿"
+    output = [["Character", "񿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+8FFFE" do
+    input = "򏿾"
+    output = [["Character", "򏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+8FFFF" do
+    input = "򏿿"
+    output = [["Character", "򏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+9FFFE" do
+    input = "򟿾"
+    output = [["Character", "򟿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+9FFFF" do
+    input = "򟿿"
+    output = [["Character", "򟿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+AFFFE" do
+    input = "򯿾"
+    output = [["Character", "򯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+AFFFF" do
+    input = "򯿿"
+    output = [["Character", "򯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+BFFFE" do
+    input = "򿿾"
+    output = [["Character", "򿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+BFFFF" do
+    input = "򿿿"
+    output = [["Character", "򿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+CFFFE" do
+    input = "󏿾"
+    output = [["Character", "󏿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+CFFFF" do
+    input = "󏿿"
+    output = [["Character", "󏿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+DFFFE" do
+    input = "󟿾"
+    output = [["Character", "󟿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+DFFFF" do
+    input = "󟿿"
+    output = [["Character", "󟿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+EFFFE" do
+    input = "󯿾"
+    output = [["Character", "󯿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+EFFFF" do
+    input = "󯿿"
+    output = [["Character", "󯿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD0" do
+    input = "﷐"
+    output = [["Character", "﷐"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD1" do
+    input = "﷑"
+    output = [["Character", "﷑"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD2" do
+    input = "﷒"
+    output = [["Character", "﷒"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD3" do
+    input = "﷓"
+    output = [["Character", "﷓"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD4" do
+    input = "﷔"
+    output = [["Character", "﷔"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD5" do
+    input = "﷕"
+    output = [["Character", "﷕"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD6" do
+    input = "﷖"
+    output = [["Character", "﷖"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD7" do
+    input = "﷗"
+    output = [["Character", "﷗"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD8" do
+    input = "﷘"
+    output = [["Character", "﷘"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDD9" do
+    input = "﷙"
+    output = [["Character", "﷙"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDDA" do
+    input = "﷚"
+    output = [["Character", "﷚"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDDB" do
+    input = "﷛"
+    output = [["Character", "﷛"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDDC" do
+    input = "﷜"
+    output = [["Character", "﷜"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDDD" do
+    input = "﷝"
+    output = [["Character", "﷝"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDDE" do
+    input = "﷞"
+    output = [["Character", "﷞"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDDF" do
+    input = "﷟"
+    output = [["Character", "﷟"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE0" do
+    input = "﷠"
+    output = [["Character", "﷠"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE1" do
+    input = "﷡"
+    output = [["Character", "﷡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE2" do
+    input = "﷢"
+    output = [["Character", "﷢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE3" do
+    input = "﷣"
+    output = [["Character", "﷣"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE4" do
+    input = "﷤"
+    output = [["Character", "﷤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE5" do
+    input = "﷥"
+    output = [["Character", "﷥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE6" do
+    input = "﷦"
+    output = [["Character", "﷦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE7" do
+    input = "﷧"
+    output = [["Character", "﷧"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE8" do
+    input = "﷨"
+    output = [["Character", "﷨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDE9" do
+    input = "﷩"
+    output = [["Character", "﷩"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDEA" do
+    input = "﷪"
+    output = [["Character", "﷪"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDEB" do
+    input = "﷫"
+    output = [["Character", "﷫"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDEC" do
+    input = "﷬"
+    output = [["Character", "﷬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDED" do
+    input = "﷭"
+    output = [["Character", "﷭"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDEE" do
+    input = "﷮"
+    output = [["Character", "﷮"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FDEF" do
+    input = "﷯"
+    output = [["Character", "﷯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FFFE" do
+    input = <<239, 191, 190>>
+    output = [["Character", <<239, 191, 190>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FFFF" do
+    input = <<239, 191, 191>>
+    output = [["Character", <<239, 191, 191>>]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FFFFE" do
+    input = "󿿾"
+    output = [["Character", "󿿾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Invalid Unicode character U+FFFFF" do
+    input = "󿿿"
+    output = [["Character", "󿿿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0009" do
+    input = "\t"
+    output = [["Character", "\t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+000A" do
+    input = "\n"
+    output = [["Character", "\n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0020" do
+    input = " "
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0021" do
+    input = "!"
+    output = [["Character", "!"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0022" do
+    input = "\""
+    output = [["Character", "\""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0023" do
+    input = "#"
+    output = [["Character", "#"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/unicodeChars_part2_test.exs b/test/floki/html/generated/tokenizer/unicodeChars_part2_test.exs
new file mode 100644
index 00000000..62b9c95f
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/unicodeChars_part2_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.UnicodecharsPart2Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests unicodeChars.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Valid Unicode character U+0024" do
+    input = "$"
+    output = [["Character", "$"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0025" do
+    input = "%"
+    output = [["Character", "%"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0026" do
+    input = "&"
+    output = [["Character", "&"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0027" do
+    input = "'"
+    output = [["Character", "'"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0028" do
+    input = "("
+    output = [["Character", "("]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0029" do
+    input = ")"
+    output = [["Character", ")"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+002A" do
+    input = "*"
+    output = [["Character", "*"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+002B" do
+    input = "+"
+    output = [["Character", "+"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+002C" do
+    input = ","
+    output = [["Character", ","]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+002D" do
+    input = "-"
+    output = [["Character", "-"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+002E" do
+    input = "."
+    output = [["Character", "."]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+002F" do
+    input = "/"
+    output = [["Character", "/"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0030" do
+    input = "0"
+    output = [["Character", "0"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0031" do
+    input = "1"
+    output = [["Character", "1"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0032" do
+    input = "2"
+    output = [["Character", "2"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0033" do
+    input = "3"
+    output = [["Character", "3"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0034" do
+    input = "4"
+    output = [["Character", "4"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0035" do
+    input = "5"
+    output = [["Character", "5"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0036" do
+    input = "6"
+    output = [["Character", "6"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0037" do
+    input = "7"
+    output = [["Character", "7"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0038" do
+    input = "8"
+    output = [["Character", "8"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0039" do
+    input = "9"
+    output = [["Character", "9"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+003A" do
+    input = ":"
+    output = [["Character", ":"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+003B" do
+    input = ";"
+    output = [["Character", ";"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+003D" do
+    input = "="
+    output = [["Character", "="]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+003E" do
+    input = ">"
+    output = [["Character", ">"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+003F" do
+    input = "?"
+    output = [["Character", "?"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0040" do
+    input = "@"
+    output = [["Character", "@"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0041" do
+    input = "A"
+    output = [["Character", "A"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0042" do
+    input = "B"
+    output = [["Character", "B"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0043" do
+    input = "C"
+    output = [["Character", "C"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0044" do
+    input = "D"
+    output = [["Character", "D"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0045" do
+    input = "E"
+    output = [["Character", "E"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0046" do
+    input = "F"
+    output = [["Character", "F"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0047" do
+    input = "G"
+    output = [["Character", "G"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0048" do
+    input = "H"
+    output = [["Character", "H"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0049" do
+    input = "I"
+    output = [["Character", "I"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+004A" do
+    input = "J"
+    output = [["Character", "J"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+004B" do
+    input = "K"
+    output = [["Character", "K"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+004C" do
+    input = "L"
+    output = [["Character", "L"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+004D" do
+    input = "M"
+    output = [["Character", "M"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+004E" do
+    input = "N"
+    output = [["Character", "N"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+004F" do
+    input = "O"
+    output = [["Character", "O"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0050" do
+    input = "P"
+    output = [["Character", "P"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0051" do
+    input = "Q"
+    output = [["Character", "Q"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0052" do
+    input = "R"
+    output = [["Character", "R"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0053" do
+    input = "S"
+    output = [["Character", "S"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0054" do
+    input = "T"
+    output = [["Character", "T"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0055" do
+    input = "U"
+    output = [["Character", "U"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0056" do
+    input = "V"
+    output = [["Character", "V"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0057" do
+    input = "W"
+    output = [["Character", "W"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0058" do
+    input = "X"
+    output = [["Character", "X"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0059" do
+    input = "Y"
+    output = [["Character", "Y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+005A" do
+    input = "Z"
+    output = [["Character", "Z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+005B" do
+    input = "["
+    output = [["Character", "["]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+005C" do
+    input = "\\"
+    output = [["Character", "\\"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+005D" do
+    input = "]"
+    output = [["Character", "]"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+005E" do
+    input = "^"
+    output = [["Character", "^"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+005F" do
+    input = "_"
+    output = [["Character", "_"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0060" do
+    input = "`"
+    output = [["Character", "`"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0061" do
+    input = "a"
+    output = [["Character", "a"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0062" do
+    input = "b"
+    output = [["Character", "b"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0063" do
+    input = "c"
+    output = [["Character", "c"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0064" do
+    input = "d"
+    output = [["Character", "d"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0065" do
+    input = "e"
+    output = [["Character", "e"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0066" do
+    input = "f"
+    output = [["Character", "f"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0067" do
+    input = "g"
+    output = [["Character", "g"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0068" do
+    input = "h"
+    output = [["Character", "h"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0069" do
+    input = "i"
+    output = [["Character", "i"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+006A" do
+    input = "j"
+    output = [["Character", "j"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+006B" do
+    input = "k"
+    output = [["Character", "k"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+006C" do
+    input = "l"
+    output = [["Character", "l"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+006D" do
+    input = "m"
+    output = [["Character", "m"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+006E" do
+    input = "n"
+    output = [["Character", "n"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+006F" do
+    input = "o"
+    output = [["Character", "o"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0070" do
+    input = "p"
+    output = [["Character", "p"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0071" do
+    input = "q"
+    output = [["Character", "q"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0072" do
+    input = "r"
+    output = [["Character", "r"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0073" do
+    input = "s"
+    output = [["Character", "s"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0074" do
+    input = "t"
+    output = [["Character", "t"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0075" do
+    input = "u"
+    output = [["Character", "u"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0076" do
+    input = "v"
+    output = [["Character", "v"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0077" do
+    input = "w"
+    output = [["Character", "w"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0078" do
+    input = "x"
+    output = [["Character", "x"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+0079" do
+    input = "y"
+    output = [["Character", "y"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+007A" do
+    input = "z"
+    output = [["Character", "z"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+007B" do
+    input = "{"
+    output = [["Character", "{"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+007C" do
+    input = "|"
+    output = [["Character", "|"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+007D" do
+    input = "}"
+    output = [["Character", "}"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+007E" do
+    input = "~"
+    output = [["Character", "~"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A0" do
+    input = " "
+    output = [["Character", " "]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A1" do
+    input = "¡"
+    output = [["Character", "¡"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A2" do
+    input = "¢"
+    output = [["Character", "¢"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A3" do
+    input = "£"
+    output = [["Character", "£"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A4" do
+    input = "¤"
+    output = [["Character", "¤"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A5" do
+    input = "¥"
+    output = [["Character", "¥"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A6" do
+    input = "¦"
+    output = [["Character", "¦"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A7" do
+    input = "§"
+    output = [["Character", "§"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A8" do
+    input = "¨"
+    output = [["Character", "¨"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00A9" do
+    input = "©"
+    output = [["Character", "©"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/unicodeChars_part3_test.exs b/test/floki/html/generated/tokenizer/unicodeChars_part3_test.exs
new file mode 100644
index 00000000..2f5fbc89
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/unicodeChars_part3_test.exs
@@ -0,0 +1,1208 @@
+defmodule Floki.HTML.Generated.Tokenizer.UnicodecharsPart3Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests unicodeChars.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Valid Unicode character U+00AA" do
+    input = "ª"
+    output = [["Character", "ª"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00AB" do
+    input = "«"
+    output = [["Character", "«"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00AC" do
+    input = "¬"
+    output = [["Character", "¬"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00AD" do
+    input = "­"
+    output = [["Character", "­"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00AE" do
+    input = "®"
+    output = [["Character", "®"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00AF" do
+    input = "¯"
+    output = [["Character", "¯"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B0" do
+    input = "°"
+    output = [["Character", "°"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B1" do
+    input = "±"
+    output = [["Character", "±"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B2" do
+    input = "²"
+    output = [["Character", "²"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B3" do
+    input = "³"
+    output = [["Character", "³"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B4" do
+    input = "´"
+    output = [["Character", "´"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B5" do
+    input = "µ"
+    output = [["Character", "µ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B6" do
+    input = "¶"
+    output = [["Character", "¶"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B7" do
+    input = "·"
+    output = [["Character", "·"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B8" do
+    input = "¸"
+    output = [["Character", "¸"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00B9" do
+    input = "¹"
+    output = [["Character", "¹"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00BA" do
+    input = "º"
+    output = [["Character", "º"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00BB" do
+    input = "»"
+    output = [["Character", "»"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00BC" do
+    input = "¼"
+    output = [["Character", "¼"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00BD" do
+    input = "½"
+    output = [["Character", "½"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00BE" do
+    input = "¾"
+    output = [["Character", "¾"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00BF" do
+    input = "¿"
+    output = [["Character", "¿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C0" do
+    input = "À"
+    output = [["Character", "À"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C1" do
+    input = "Á"
+    output = [["Character", "Á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C2" do
+    input = "Â"
+    output = [["Character", "Â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C3" do
+    input = "Ã"
+    output = [["Character", "Ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C4" do
+    input = "Ä"
+    output = [["Character", "Ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C5" do
+    input = "Å"
+    output = [["Character", "Å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C6" do
+    input = "Æ"
+    output = [["Character", "Æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C7" do
+    input = "Ç"
+    output = [["Character", "Ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C8" do
+    input = "È"
+    output = [["Character", "È"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00C9" do
+    input = "É"
+    output = [["Character", "É"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00CA" do
+    input = "Ê"
+    output = [["Character", "Ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00CB" do
+    input = "Ë"
+    output = [["Character", "Ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00CC" do
+    input = "Ì"
+    output = [["Character", "Ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00CD" do
+    input = "Í"
+    output = [["Character", "Í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00CE" do
+    input = "Î"
+    output = [["Character", "Î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00CF" do
+    input = "Ï"
+    output = [["Character", "Ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D0" do
+    input = "Ð"
+    output = [["Character", "Ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D1" do
+    input = "Ñ"
+    output = [["Character", "Ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D2" do
+    input = "Ò"
+    output = [["Character", "Ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D3" do
+    input = "Ó"
+    output = [["Character", "Ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D4" do
+    input = "Ô"
+    output = [["Character", "Ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D5" do
+    input = "Õ"
+    output = [["Character", "Õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D6" do
+    input = "Ö"
+    output = [["Character", "Ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D7" do
+    input = "×"
+    output = [["Character", "×"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D8" do
+    input = "Ø"
+    output = [["Character", "Ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00D9" do
+    input = "Ù"
+    output = [["Character", "Ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00DA" do
+    input = "Ú"
+    output = [["Character", "Ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00DB" do
+    input = "Û"
+    output = [["Character", "Û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00DC" do
+    input = "Ü"
+    output = [["Character", "Ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00DD" do
+    input = "Ý"
+    output = [["Character", "Ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00DE" do
+    input = "Þ"
+    output = [["Character", "Þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00DF" do
+    input = "ß"
+    output = [["Character", "ß"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E0" do
+    input = "à"
+    output = [["Character", "à"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E1" do
+    input = "á"
+    output = [["Character", "á"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E2" do
+    input = "â"
+    output = [["Character", "â"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E3" do
+    input = "ã"
+    output = [["Character", "ã"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E4" do
+    input = "ä"
+    output = [["Character", "ä"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E5" do
+    input = "å"
+    output = [["Character", "å"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E6" do
+    input = "æ"
+    output = [["Character", "æ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E7" do
+    input = "ç"
+    output = [["Character", "ç"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E8" do
+    input = "è"
+    output = [["Character", "è"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00E9" do
+    input = "é"
+    output = [["Character", "é"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00EA" do
+    input = "ê"
+    output = [["Character", "ê"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00EB" do
+    input = "ë"
+    output = [["Character", "ë"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00EC" do
+    input = "ì"
+    output = [["Character", "ì"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00ED" do
+    input = "í"
+    output = [["Character", "í"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00EE" do
+    input = "î"
+    output = [["Character", "î"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00EF" do
+    input = "ï"
+    output = [["Character", "ï"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F0" do
+    input = "ð"
+    output = [["Character", "ð"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F1" do
+    input = "ñ"
+    output = [["Character", "ñ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F2" do
+    input = "ò"
+    output = [["Character", "ò"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F3" do
+    input = "ó"
+    output = [["Character", "ó"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F4" do
+    input = "ô"
+    output = [["Character", "ô"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F5" do
+    input = "õ"
+    output = [["Character", "õ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F6" do
+    input = "ö"
+    output = [["Character", "ö"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F7" do
+    input = "÷"
+    output = [["Character", "÷"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F8" do
+    input = "ø"
+    output = [["Character", "ø"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00F9" do
+    input = "ù"
+    output = [["Character", "ù"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00FA" do
+    input = "ú"
+    output = [["Character", "ú"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00FB" do
+    input = "û"
+    output = [["Character", "û"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00FC" do
+    input = "ü"
+    output = [["Character", "ü"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00FD" do
+    input = "ý"
+    output = [["Character", "ý"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00FE" do
+    input = "þ"
+    output = [["Character", "þ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+00FF" do
+    input = "ÿ"
+    output = [["Character", "ÿ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+10000" do
+    input = "𐀀"
+    output = [["Character", "𐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+100000" do
+    input = "􀀀"
+    output = [["Character", "􀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+10FFFD" do
+    input = "􏿽"
+    output = [["Character", "􏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+1FFFD" do
+    input = "🿽"
+    output = [["Character", "🿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+20000" do
+    input = "𠀀"
+    output = [["Character", "𠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+2FFFD" do
+    input = "𯿽"
+    output = [["Character", "𯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+30000" do
+    input = "𰀀"
+    output = [["Character", "𰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+3FFFD" do
+    input = "𿿽"
+    output = [["Character", "𿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+40000" do
+    input = "񀀀"
+    output = [["Character", "񀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+4FFFD" do
+    input = "񏿽"
+    output = [["Character", "񏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+50000" do
+    input = "񐀀"
+    output = [["Character", "񐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+5FFFD" do
+    input = "񟿽"
+    output = [["Character", "񟿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+60000" do
+    input = "񠀀"
+    output = [["Character", "񠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+6FFFD" do
+    input = "񯿽"
+    output = [["Character", "񯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/html/generated/tokenizer/unicodeChars_part4_test.exs b/test/floki/html/generated/tokenizer/unicodeChars_part4_test.exs
new file mode 100644
index 00000000..5b9e16b9
--- /dev/null
+++ b/test/floki/html/generated/tokenizer/unicodeChars_part4_test.exs
@@ -0,0 +1,284 @@
+defmodule Floki.HTML.Generated.Tokenizer.UnicodecharsPart4Test do
+  use ExUnit.Case, async: true
+
+  # NOTE: This file was generated by "mix generate_tokenizer_tests unicodeChars.test".
+  # html5lib-tests rev: e52ff68cc7113a6ef3687747fa82691079bf9cc5
+
+  alias Floki.HTML.Tokenizer
+
+  test "tokenize/1 Valid Unicode character U+70000" do
+    input = "񰀀"
+    output = [["Character", "񰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+7FFFD" do
+    input = "񿿽"
+    output = [["Character", "񿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+80000" do
+    input = "򀀀"
+    output = [["Character", "򀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+8FFFD" do
+    input = "򏿽"
+    output = [["Character", "򏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+90000" do
+    input = "򐀀"
+    output = [["Character", "򐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+9FFFD" do
+    input = "򟿽"
+    output = [["Character", "򟿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+A0000" do
+    input = "򠀀"
+    output = [["Character", "򠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+AFFFD" do
+    input = "򯿽"
+    output = [["Character", "򯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+B0000" do
+    input = "򰀀"
+    output = [["Character", "򰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+BFFFD" do
+    input = "򿿽"
+    output = [["Character", "򿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+C0000" do
+    input = "󀀀"
+    output = [["Character", "󀀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+CFFFD" do
+    input = "󏿽"
+    output = [["Character", "󏿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+D0000" do
+    input = "󐀀"
+    output = [["Character", "󐀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+D7FF" do
+    input = "퟿"
+    output = [["Character", "퟿"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+DFFFD" do
+    input = "󟿽"
+    output = [["Character", "󟿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+E000" do
+    input = ""
+    output = [["Character", ""]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+E0000" do
+    input = "󠀀"
+    output = [["Character", "󠀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+EFFFD" do
+    input = "󯿽"
+    output = [["Character", "󯿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+F0000" do
+    input = "󰀀"
+    output = [["Character", "󰀀"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+FDCF" do
+    input = "﷏"
+    output = [["Character", "﷏"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+FDF0" do
+    input = "ﷰ"
+    output = [["Character", "ﷰ"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+FFFD" do
+    input = "�"
+    output = [["Character", "�"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+
+  test "tokenize/1 Valid Unicode character U+FFFFD" do
+    input = "󿿽"
+    output = [["Character", "󿿽"]]
+
+    result =
+      input
+      |> Tokenizer.tokenize()
+      |> TokenizerTestLoader.tokenization_result()
+
+    assert result.tokens == output
+  end
+end
diff --git a/test/floki/selector/parser_test.exs b/test/floki/selector/parser_test.exs
index 41804ee9..1225efaf 100644
--- a/test/floki/selector/parser_test.exs
+++ b/test/floki/selector/parser_test.exs
@@ -43,16 +43,30 @@ defmodule Floki.Selector.ParserTest do
     assert Parser.parse(tokens) == [%Selector{type: "img", id: "logo"}]
   end
 
+  test "id containing periods" do
+    tokens = tokenize("#my\\.example\\.com-port-filters.big.blue")
+
+    assert Parser.parse(tokens) == [
+             %Selector{id: "my.example.com-port-filters", classes: ["blue", "big"]}
+           ]
+  end
+
   test "class with attributes" do
     tokens =
       tokenize("""
-      .link[href='settings.html'][data-env|=test][section~=admin][page^=pass][page$=auth][title*=chan]
+      .link[href='settings.html'][data-env|=test][section~=admin][page^=pass][page$=auth][title*=chan][name='test' i]
       """)
 
     assert Parser.parse(tokens) == [
              %Selector{
                classes: ["link"],
                attributes: [
+                 %AttributeSelector{
+                   attribute: "name",
+                   flag: "i",
+                   match_type: :equal,
+                   value: "test"
+                 },
                  %AttributeSelector{
                    match_type: :substring_match,
                    attribute: "title",
diff --git a/test/floki/selector_test.exs b/test/floki/selector_test.exs
index c8611aa3..3a06f47d 100644
--- a/test/floki/selector_test.exs
+++ b/test/floki/selector_test.exs
@@ -5,7 +5,13 @@ defmodule Floki.SelectorTest do
   alias Selector.{AttributeSelector, PseudoClass, Combinator}
 
   test "to_string/1 (String.Chars protocol)" do
-    attribute1 = %AttributeSelector{match_type: :equal, attribute: "href", value: "#home"}
+    attribute1 = %AttributeSelector{
+      match_type: :equal,
+      attribute: "href",
+      value: "#home",
+      flag: "i"
+    }
+
     pseudo_class1 = %PseudoClass{name: "nth-child", value: 7}
 
     selector = %Selector{
@@ -21,7 +27,7 @@ defmodule Floki.SelectorTest do
       }
     }
 
-    assert to_string(selector) == "ns | div#main.foo.bar[href='#home']:nth-child(7) + a"
+    assert to_string(selector) == "ns | div#main.foo.bar[href='#home' i]:nth-child(7) + a"
 
     pseudo_class2 = %PseudoClass{name: "first"}
     assert to_string(%Selector{type: "li", pseudo_classes: [pseudo_class2]}) == "li:first"
diff --git a/test/floki_test.exs b/test/floki_test.exs
index 330185fe..1ef20b8c 100644
--- a/test/floki_test.exs
+++ b/test/floki_test.exs
@@ -592,6 +592,70 @@ defmodule FlokiTest do
            ]
   end
 
+  test "find elements only by given case-insensitive attribute value" do
+    attribute_selector = "meta[name='robots' i]"
+    html = document!(html_body(~s(<meta name="ROBOTS" content="INDEX, FOLLOW, NOIMAGEINDEX"/>)))
+
+    assert Floki.find(html, attribute_selector) == [
+             {
+               "meta",
+               [
+                 {"name", "ROBOTS"},
+                 {"content", "INDEX, FOLLOW, NOIMAGEINDEX"}
+               ],
+               []
+             }
+           ]
+  end
+
+  test "find elements by the attribute's |= selector with case-insensitive flag" do
+    attribute_selector = "a[href|='HTTP://ELIXIR' i]"
+
+    assert Floki.find(document!(@html), attribute_selector) == [
+             {
+               "a",
+               [{"href", "http://elixir-lang.org"}, {"class", "js-elixir js-cool"}],
+               ["Elixir lang"]
+             }
+           ]
+  end
+
+  test "find elements by the attribute's ^= selector with case-insensitive flag" do
+    attribute_selector = "a[href^='HTTP://G' i]"
+
+    assert Floki.find(document!(@html), attribute_selector) == [
+             {
+               "a",
+               [{"href", "http://google.com"}, {"class", "js-google js-cool"}],
+               ["Google"]
+             }
+           ]
+  end
+
+  test "find elements by the attribute's $= selector with case-insensitive flag" do
+    attribute_selector = "a[href$='.ORG' i]"
+
+    assert Floki.find(document!(@html), attribute_selector) == [
+             {
+               "a",
+               [{"href", "http://elixir-lang.org"}, {"class", "js-elixir js-cool"}],
+               ["Elixir lang"]
+             }
+           ]
+  end
+
+  test "find elements by the attribute's *= selector with case-insensitive flag" do
+    attribute_selector = "a[class*='GOOGLE' i]"
+
+    assert Floki.find(document!(@html), attribute_selector) == [
+             {
+               "a",
+               [{"href", "http://google.com"}, {"class", "js-google js-cool"}],
+               ["Google"]
+             }
+           ]
+  end
+
   # Floki.find/2 - Selector with descendant combinator
 
   test "get elements descending the parent" do
@@ -1120,6 +1184,15 @@ defmodule FlokiTest do
            ] = Floki.find(doc, ":disabled")
   end
 
+  test "root pseudo-class" do
+    doc = document!(html_body("<div><div>a</div><div>b</div></div>"))
+
+    assert [
+             {"div", [], ["a"]},
+             {"div", [], ["b"]}
+           ] = Floki.find(doc, ":root>body>div>div")
+  end
+
   # Floki.find/2 - XML and invalid HTML
 
   test "get elements inside a XML structure" do
@@ -1144,7 +1217,7 @@ defmodule FlokiTest do
     assert Floki.find(xml, "x | bar") == [{"x:bar", [], ["42"]}]
   end
 
-  @tag timeout: 50
+  @tag timeout: 100
   test "find an inexistent element inside a invalid HTML" do
     {:ok, doc} = Floki.parse_fragment("foobar<a")
 
diff --git a/test/html5lib-tests b/test/html5lib-tests
new file mode 160000
index 00000000..e52ff68c
--- /dev/null
+++ b/test/html5lib-tests
@@ -0,0 +1 @@
+Subproject commit e52ff68cc7113a6ef3687747fa82691079bf9cc5
diff --git a/test/support/tokenizer_test_loader.ex b/test/support/tokenizer_test_loader.ex
new file mode 100644
index 00000000..7ed2b51d
--- /dev/null
+++ b/test/support/tokenizer_test_loader.ex
@@ -0,0 +1,91 @@
+defmodule TokenizerTestLoader do
+  alias Floki.HTML.Tokenizer
+
+  @moduledoc """
+  It helps with tests from the tokenizer
+  """
+
+  defmodule HTMLTestResult do
+    defstruct errors: [], tokens: []
+  end
+
+  @doc """
+  It transforms the tokens from the tokenizer state into the
+  tokens from HTML5lib test file format.
+  """
+  def tokenization_result(state = %Tokenizer.State{}) do
+    output_tokens =
+      state.tokens
+      |> Enum.map(&transform_token/1)
+      |> Enum.reverse()
+      |> Enum.reduce([], fn token, tokens ->
+        if token do
+          [token | tokens]
+        else
+          tokens
+        end
+      end)
+
+    output_errors =
+      state.errors
+      |> Enum.map(fn {:parse_error, id} ->
+        %{
+          "code" => id
+        }
+      end)
+      |> Enum.reverse()
+
+    %HTMLTestResult{tokens: output_tokens, errors: output_errors}
+  end
+
+  defp transform_token(doctype = %Tokenizer.Doctype{}) do
+    [
+      "DOCTYPE",
+      doctype.name && IO.chardata_to_string(doctype.name),
+      doctype.public_id && IO.chardata_to_string(doctype.public_id),
+      doctype.system_id && IO.chardata_to_string(doctype.system_id),
+      doctype.force_quirks == :off
+    ]
+  end
+
+  defp transform_token(comment = %Tokenizer.Comment{}) do
+    [
+      "Comment",
+      IO.chardata_to_string(comment.data)
+    ]
+  end
+
+  defp transform_token(tag = %Tokenizer.StartTag{}) do
+    list_tag = [
+      "StartTag",
+      IO.chardata_to_string(tag.name),
+      Enum.reduce(tag.attributes, %{}, fn attr, attributes ->
+        Map.put(attributes, IO.chardata_to_string(attr.name), IO.chardata_to_string(attr.value))
+      end)
+    ]
+
+    if tag.self_close do
+      list_tag ++ [true]
+    else
+      list_tag
+    end
+  end
+
+  defp transform_token(tag = %Tokenizer.EndTag{}) do
+    [
+      "EndTag",
+      IO.chardata_to_string(tag.name)
+    ]
+  end
+
+  defp transform_token({:char, chars}) do
+    [
+      "Character",
+      IO.chardata_to_string(chars)
+    ]
+  end
+
+  defp transform_token(:eof), do: nil
+
+  defp transform_token(other), do: other
+end
diff --git a/test/test_helper.exs b/test/test_helper.exs
index 30bdff95..c022d02d 100644
--- a/test/test_helper.exs
+++ b/test/test_helper.exs
@@ -13,4 +13,5 @@ ExUnit.configure(
   include: [only_parser: nil, only_parser: current_parser]
 )
 
+Application.put_env(:ex_unit, :module_load_timeout, 120_000)
 ExUnit.start()