Add a suite of memory leak tests

[fur] / parsing.py
diff --git a/parsing.py b/parsing.py

index 462c2b4..041f3aa 100644 (file)
--- a/parsing.py
+++ b/parsing.py
@@ -1,5 +1,11 @@
  import collections
  
+def consume_newlines(index, tokens):
+    while index < len(tokens) and tokens[index].type == 'newline':
+        index += 1
+
+    return True, index, None
+
  def _or_parser(*parsers):
      def result_parser(index, tokens):
          failure = (False, index, None)
@@ -58,6 +64,7 @@ FurNegationExpression = collections.namedtuple(
      ],
  )
  
+# TODO We don't need to wrap this type
  FurParenthesizedExpression = collections.namedtuple(
      'FurParenthesizedExpression',
      [
@@ -65,89 +72,11 @@ FurParenthesizedExpression = collections.namedtuple(
      ],
  )
  
-FurAdditionExpression = collections.namedtuple(
-    'FurAdditionExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurSubtractionExpression = collections.namedtuple(
-    'FurSubtractionExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurMultiplicationExpression = collections.namedtuple(
-    'FurMultiplicationExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurIntegerDivisionExpression = collections.namedtuple(
-    'FurIntegerDivisionExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurModularDivisionExpression = collections.namedtuple(
-    'FurModularDivisionExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurEqualityExpression = collections.namedtuple(
-    'FurEqualityExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurInequalityExpression = collections.namedtuple(
-    'FurInequalityExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurLessThanOrEqualExpression = collections.namedtuple(
-    'FurLessThanOrEqualExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurGreaterThanOrEqualExpression = collections.namedtuple(
-    'FurGreaterThanOrEqualExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurLessThanExpression = collections.namedtuple(
-    'FurLessThanExpression',
-    [
-        'left',
-        'right',
-    ],
-)
-
-FurGreaterThanExpression = collections.namedtuple(
-    'FurGreaterThanExpression',
+FurInfixExpression = collections.namedtuple(
+    'FurInfixExpression',
      [
+        'order',
+        'operator',
          'left',
          'right',
      ],
@@ -220,7 +149,7 @@ def _literal_level_expression_parser(index, tokens):
          _symbol_expression_parser,
      )(index, tokens)
  
-def _left_recursive_infix_operator_parser(token_type, operand_parser, operator_to_expression_type_mapping):
+def _left_recursive_infix_operator_parser(operator_token_matcher, operand_parser, order):
      def result_parser(index, tokens):
          failure = (False, index, None)
  
@@ -229,14 +158,19 @@ def _left_recursive_infix_operator_parser(token_type, operand_parser, operator_t
          if not success:
              return failure
  
-        while success and index < len(tokens) and tokens[index].type == token_type:
+        while success and index < len(tokens) and operator_token_matcher(tokens[index]):
              success = False
  
              if index + 1 < len(tokens):
                  success, try_index, value = operand_parser(index + 1, tokens)
  
              if success:
-                result = operator_to_expression_type_mapping[tokens[index].match](left=result, right=value)
+                result = FurInfixExpression(
+                    order=order,
+                    operator=tokens[index].match,
+                    left=result,
+                    right=value,
+                )
                  index = try_index
  
          return True, index, result
@@ -245,41 +179,41 @@ def _left_recursive_infix_operator_parser(token_type, operand_parser, operator_t
  
  def _multiplication_level_expression_parser(index, tokens):
      return _left_recursive_infix_operator_parser(
-        'multiplication_level_operator',
+        lambda token: token.type == 'multiplication_level_operator',
          _literal_level_expression_parser,
-        {
-            '*': FurMultiplicationExpression,
-            '//': FurIntegerDivisionExpression,
-            '%': FurModularDivisionExpression,
-        },
+        'multiplication_level',
      )(index, tokens)
  
  def _addition_level_expression_parser(index, tokens):
      return _left_recursive_infix_operator_parser(
-        'addition_level_operator',
+        lambda token: token.type == 'addition_level_operator',
          _multiplication_level_expression_parser,
-        {
-            '+': FurAdditionExpression,
-            '-': FurSubtractionExpression,
-        },
+        'addition_level',
      )(index, tokens)
  
-def _equality_level_expression_parser(index, tokens):
+def _comparison_level_expression_parser(index, tokens):
      return _left_recursive_infix_operator_parser(
-        'equality_level_operator',
+        lambda token: token.type == 'comparison_level_operator',
          _addition_level_expression_parser,
-        {
-            '==': FurEqualityExpression,
-            '!=': FurInequalityExpression,
-            '>=': FurGreaterThanOrEqualExpression,
-            '<=': FurLessThanOrEqualExpression,
-            '>': FurGreaterThanExpression,
-            '<': FurLessThanExpression,
-        },
+        'comparison_level',
+    )(index, tokens)
+
+def _and_level_expression_parser(index, tokens):
+    return _left_recursive_infix_operator_parser(
+        lambda token: token.type == 'symbol' and token.match == 'and',
+        _comparison_level_expression_parser,
+        'and_level',
+    )(index, tokens)
+
+def _or_level_expression_parser(index, tokens):
+    return _left_recursive_infix_operator_parser(
+        lambda token: token.type == 'symbol' and token.match == 'or',
+        _and_level_expression_parser,
+        'or_level',
      )(index, tokens)
  
  def _comma_separated_list_parser(index, tokens):
-    failure = (False, index, None)
+    start_index = index
  
      expressions = []
  
@@ -288,7 +222,7 @@ def _comma_separated_list_parser(index, tokens):
      if success:
          expressions.append(expression)
      else:
-        return failure
+        return (True, start_index, ())
  
      while success and index < len(tokens) and tokens[index].type == 'comma':
          success = False
@@ -311,6 +245,13 @@ FurFunctionCallExpression = collections.namedtuple(
      ],
  )
  
+FurExpressionStatement = collections.namedtuple(
+    'FurExpressionStatement',
+    [
+        'expression',
+    ],
+)
+
  FurAssignmentStatement = collections.namedtuple(
      'FurAssignmentStatement',
      [
@@ -319,6 +260,14 @@ FurAssignmentStatement = collections.namedtuple(
      ],
  )
  
+FurFunctionDefinitionStatement = collections.namedtuple(
+    'FurFunctionDefinitionStatement',
+    [
+        'name',
+        'statement_list',
+    ],
+)
+
  FurProgram = collections.namedtuple(
      'FurProgram',
      [
@@ -353,7 +302,17 @@ def _function_call_expression_parser(index, tokens):
  
      return True, index, FurFunctionCallExpression(function=function, arguments=arguments)
  
-_expression_parser = _equality_level_expression_parser
+_expression_parser = _or_level_expression_parser
+
+def _expression_statement_parser(index, tokens):
+    failure = (False, index, None)
+
+    success, index, expression = _expression_parser(index, tokens)
+
+    if not success:
+        return failure
+
+    return (True, index, FurExpressionStatement(expression=expression))
  
  def _assignment_statement_parser(index, tokens):
      # TODO Use a FurSymbolExpression for the target? Maybe this is actually not a good idea
@@ -379,11 +338,65 @@ def _assignment_statement_parser(index, tokens):
  
      return True, index, FurAssignmentStatement(target=target, expression=expression)
  
+def _function_definition_statement_parser(index, tokens):
+    failure = (False, index, None)
+
+    if tokens[index].type == 'keyword' and tokens[index].match == 'def':
+        index += 1
+    else:
+        return failure
+
+    if tokens[index].type == 'symbol':
+        name = tokens[index].match
+        index += 1
+    else:
+        raise Exception('Expected function name, found "{}" on line {}'.format(
+            tokens[index].match,
+            tokens[index].line,
+        ))
+
+    if tokens[index].type == 'open_parenthese':
+        index += 1
+    else:
+        raise Exception('Expected "(", found "{}" on line {}'.format(
+            tokens[index].match,
+            tokens[index].line,
+        ))
+
+    if tokens[index].type == 'close_parenthese':
+        index += 1
+    else:
+        raise Exception('Expected ")", found "{}" on line {}'.format(
+            tokens[index].match,
+            tokens[index].line,
+        ))
+
+    if tokens[index].type == 'symbol' and tokens[index].match == 'do':
+        index += 1
+    else:
+        return failure
+
+    success, index, statement_list = _zero_or_more_parser(tuple, _statement_parser)(index, tokens)
+
+    _, index, _ = consume_newlines(index, tokens)
+
+    if tokens[index].type == 'keyword' and tokens[index].match == 'end':
+        index += 1
+    else:
+        return failure
+
+    return True, index, FurFunctionDefinitionStatement(name=name, statement_list=statement_list)
+
  def _statement_parser(index, tokens):
-    # TODO It would be good to include newlines in the parsing of this because it removes the ambiguity between "function(argument)" (one statement) and "function\n(argument)" (two statements)
+    _, index, _ = consume_newlines(index, tokens)
+
+    if index == len(tokens):
+        return (False, index, None)
+
      return _or_parser(
          _assignment_statement_parser,
-        _expression_parser,
+        _expression_statement_parser,
+        _function_definition_statement_parser,
      )(index, tokens)
  
  def _program_formatter(statement_list):