json5_generator.py | Explore in Territory

# Copyright 2017 The Chromium Authors
# Use of this source code is governed by a BSD-style license that can be
# found in the LICENSE file.
"""Generic generator for configuration files in JSON5 format.

The configuration file is expected to contain either a data array or a data map,
an optional parameters validation map, and an optional metdata map. Examples:
{
  data: [
    "simple_item",
    "simple_item2",
    {name:"complex_item", param:"Hello World"},
  ],
}

{
  metadata: {
    namespace: "css",
  },
  parameters: {
    param1: {default: 1, valid_values:[1,2,3]},
    param2: {valid_type: "str"},
    param3: {valid_keys:["a", "b"], valid_values:["x", "y"]}
  },
  data: {
    "simple_item": {},
    "item": {param1:1, param2: "Hello World", param3:{"a":"x", "b":"y"}},
    "also_valid_item": {param2: "valid", param3: "x"}
    "bad_item_fails_validation": {
      name: "bad_item_fails_validation",
      param1: "bad_value_fails_valid_values_check",
      param2: 1.9,
      param3: {"bad": "value"}
      unknown_param_fails_validation: true,
    },
  },
}

The entries in data array/map are stored in the array self.name_dictionaries.
Each entry in name_dictionaries is always stored as a dictionary.
A simple non-map item is converted to a dictionary containing one entry with
key of "name" and its value the simple item.

The order of entries in name_dictionaries is the same as that specified in the
data array. While for the data map case, by default the entries are sorted
alphabetically by name.

The optional map "parameters" specifies the default values and the valid values
or valid types contained in the data entries. If parameters is specified, then
data entries may not contain keys not present in parameters.

The optional map "metadata" overrides the values specified in default_metadata
if present, and stored as self.metadata. Keys in "metadata" must be present in
default_metadata or an exception raised.
"""

import argparse
import copy
import json5
import os
import os.path
import re

from blinkbuild.name_style_converter import NameStyleConverter


def _merge_doc(doc, doc2):
    def _merge_dict(key):
        if key in doc or key in doc2:
            merged = doc.get(key, {})
            merged.update(doc2.get(key, {}))
            doc[key] = merged

    _merge_dict("metadata")
    _merge_dict("parameters")
    if type(doc["data"]) is list:
        doc["data"].extend(doc2["data"])
    else:
        _merge_dict("data")


def _is_valid(valid_values, value, valid_keys=None):
    if type(value) == str and all([type(i) == str for i in valid_values]):
        return any([(value == valid)
                    or (re.match("^" + valid + "$", value) is not None)
                    for valid in valid_values])
    elif isinstance(value, dict):
        assert valid_keys, "'valid_keys' must be declared when using a dict value"
        return all([(key in valid_keys or key == "default")
                    and (val in valid_values or val == "")
                    for key, val in value.items()])
    else:
        return value in valid_values


class Json5File(object):
    def __init__(self,
                 file_paths,
                 doc,
                 default_metadata=None,
                 default_parameters=None):
        self.file_paths = file_paths
        self.name_dictionaries = []
        self.metadata = copy.deepcopy(
            default_metadata if default_metadata else {})
        self.parameters = copy.deepcopy(
            default_parameters if default_parameters else {})
        self._defaults = {}
        self._process(doc)

    @classmethod
    def load_from_files(cls,
                        file_paths,
                        default_metadata=None,
                        default_parameters=None):
        merged_doc = dict()
        for path in file_paths:
            assert path.endswith(".json5")
            with open(os.path.abspath(path), encoding='utf-8') as json5_file:
                doc = json5.loads(json5_file.read())
                if not merged_doc:
                    merged_doc = doc
                else:
                    _merge_doc(merged_doc, doc)
        return Json5File(file_paths, merged_doc, default_metadata,
                         default_parameters)

    def _process(self, doc):
        # Process optional metadata map entries.
        for key, value in doc.get("metadata", {}).items():
            self._process_metadata(key, value)
        # Get optional parameters map, and get the default value map from it.
        self.parameters.update(doc.get("parameters", {}))
        if self.parameters:
            self._get_defaults()
        # Process normal entries.
        items = doc["data"]
        if type(items) is list:
            for item in items:
                entry = self._get_entry(item)
                self.name_dictionaries.append(entry)
        else:
            for key, value in items.items():
                value["name"] = key
                entry = self._get_entry(value)
                self.name_dictionaries.append(entry)
            self.name_dictionaries.sort(key=lambda entry: entry["name"])

    def _process_metadata(self, key, value):
        if key not in self.metadata:
            raise Exception("Unknown metadata: '%s'\nKnown metadata: %s" %
                            (key, self.metadata.keys()))
        self.metadata[key] = value

    def _get_defaults(self):
        for key, value in self.parameters.items():
            if value and "default" in value:
                self._defaults[key] = value["default"]
            else:
                self._defaults[key] = None

    def _get_entry(self, item):
        entry = copy.deepcopy(self._defaults)
        if type(item) is not dict:
            entry["name"] = NameStyleConverter(item)
            return entry
        if "name" not in item:
            raise Exception("Missing name in item: %s" % item)
        if not self.parameters:
            entry.update(item)
            return entry
        assert "name" not in self.parameters, \
            "The parameter 'name' is reserved, use a different name."
        entry["name"] = NameStyleConverter(item.pop("name"))
        # Validate parameters if it's specified.
        for key, value in item.items():
            if key not in self.parameters:
                raise Exception("Unknown parameter: '%s'\nKnown params: %s" %
                                (key, self.parameters.keys()))
            assert self.parameters[key] is not None, \
                "Specification for parameter 'key' cannot be None. Use {} instead."
            self._validate_parameter(self.parameters[key], value)
            entry[key] = value
        return entry

    def _validate_parameter(self, parameter, value):
        valid_type = parameter.get("valid_type")
        if valid_type and type(value).__name__ != valid_type:
            raise Exception("Incorrect type: '%s'\nExpected type: %s" %
                            (type(value).__name__, valid_type))
        valid_values = parameter.get("valid_values")
        if not valid_values:
            return
        valid_keys = parameter.get("valid_keys")
        # If valid_values is a list of simple items and not list of list, then
        # validate each item in the value list against valid_values.
        if valid_type == "list" and type(valid_values[0]) is not list:
            for item in value:
                if not _is_valid(valid_values, item):
                    raise Exception("Unknown value: '%s'\nValid values: %s, \
                        Please change your value to a valid value" %
                                    (item, valid_values))
        elif not _is_valid(valid_values, value, valid_keys):
            message = "Unknown value: '%s'\nValid values: %s, \
                Please change your value to a valid value" % (value,
                                                              valid_values)
            if isinstance(value, dict):
                message = ("Unknown key or value in: %s\n" \
                           "Please choose your keys and values from the list below:\n" \
                           "Valid keys: %s\nValid values: %s" %
                           (value, valid_keys, valid_values))
            raise Exception(message)

    def merge_from(self, doc):
        self._process(doc)


def reject_duplicates(entries):
    assert isinstance(entries, list), 'The data should be a list.'
    name_dict = {}
    for entry in entries:
        name = entry['name'].original
        if name in name_dict:
            raise Exception(
                'The data contains multiple entries for "%s".' % name)
        name_dict[name] = entry


def remove_duplicates(entries):
    assert isinstance(entries, list), 'The data should be a list.'
    name_dict = {}
    filtered_list = []
    for entry in entries:
        name = entry['name'].original
        if name in name_dict:
            if entry != name_dict[name]:
                raise Exception(
                    'Duplicated entries for "%s" must be identical.' % name)
        else:
            name_dict[name] = entry
            filtered_list.append(entry)
    return filtered_list


class Writer(object):
    # Subclasses should override.
    class_name = None
    default_metadata = None
    default_parameters = None
    snake_case_source_files = False

    def __init__(self, json5_files, output_dir):
        self._input_files = copy.copy(json5_files)
        self._outputs = {}  # file_name -> generator
        # A set of filenames that were formerly generated, but aren't anymore.
        # Files present in this set will be deleted to prevent erroneous
        # inclusion of stale generated headers for incremental builds.
        self._cleanup = set()
        self.gperf_path = None
        if json5_files:
            self.json5_file = Json5File.load_from_files(
                json5_files, self.default_metadata, self.default_parameters)
        match = re.search(r'\bgen[\\/]', output_dir)
        if match:
            self._relative_output_dir = output_dir[match.end():].replace(
                os.path.sep, '/') + '/'
        else:
            self._relative_output_dir = ''

    def _write_file_if_changed(self, output_dir, contents, file_name):
        path = os.path.join(output_dir, file_name)

        # The build system should ensure our output directory exists, but just
        # in case.
        directory = os.path.dirname(path)
        if not os.path.exists(directory):
            os.makedirs(directory)

        # Only write the file if the contents have changed. This allows ninja to
        # skip rebuilding targets which depend on the output.
        with open(path, "a+", newline='') as output_file:
            output_file.seek(0)
            if output_file.read() != contents:
                output_file.truncate(0)
                output_file.write(contents)

    def write_files(self, output_dir):
        for file_name, generator in self._outputs.items():
            self._write_file_if_changed(output_dir, generator(), file_name)

    def cleanup_files(self, output_dir):
        for file_name in self._cleanup:
            path = os.path.join(output_dir, file_name)
            try:
                os.remove(path)
            except OSError:
                pass

    def set_gperf_path(self, gperf_path):
        self.gperf_path = gperf_path

    def get_file_basename(self, name):
        return NameStyleConverter(name).to_snake_case()

    def make_header_guard(self, path):
        return NameStyleConverter(path).to_header_guard()


class Maker(object):
    def __init__(self, writer_class):
        self._writer_class = writer_class

    def main(self):
        parser = argparse.ArgumentParser()
        # Require at least one input file.
        parser.add_argument("files", nargs="+")

        parser.add_argument("--gperf", default="gperf")
        parser.add_argument("--output_dir", default=os.getcwd())
        parser.add_argument("--generate_tag_enum",
                            default=False,
                            action='store_true')
        args = parser.parse_args()

        if args.generate_tag_enum:
            writer = self._writer_class(args.files, args.output_dir,
                                        args.generate_tag_enum)
        else:
            writer = self._writer_class(args.files, args.output_dir)
        writer.set_gperf_path(args.gperf)
        writer.write_files(args.output_dir)
        writer.cleanup_files(args.output_dir)
chromium/third_party/blink/renderer/build/scripts/json5_generator.py