@arizeai/phoenix-mcp

Official

Overview Schema Related Servers Score Discussions

test_datasets.py•19.4 KiB

import gzip
from datetime import datetime
from io import StringIO
from pathlib import Path
from typing import Any
from unittest.mock import Mock, mock_open, patch

import pandas as pd
import pytest

from phoenix.client.__generated__ import v1
from phoenix.client.resources.datasets import (
    Dataset,
    DatasetKeys,
    DatasetUploadError,
    _get_csv_column_headers,  # pyright: ignore[reportPrivateUsage]
    _infer_keys,  # pyright: ignore[reportPrivateUsage]
    _is_all_dict,  # pyright: ignore[reportPrivateUsage]
    _is_input_dataset_example,  # pyright: ignore[reportPrivateUsage]
    _parse_datetime,  # pyright: ignore[reportPrivateUsage]
    _prepare_csv,  # pyright: ignore[reportPrivateUsage]
    _prepare_dataframe_as_csv,  # pyright: ignore[reportPrivateUsage]
)


class TestDataset:
    @pytest.fixture
    def dataset_info(self) -> v1.DatasetWithExampleCount:
        return v1.DatasetWithExampleCount(
            id="dataset123",
            name="Test Dataset",
            description="A test dataset",
            metadata={"key": "value"},
            created_at="2024-01-15T10:00:00",
            updated_at="2024-01-15T11:00:00",
            example_count=2,
        )

    @pytest.fixture
    def examples_data(self) -> v1.ListDatasetExamplesData:
        return v1.ListDatasetExamplesData(
            dataset_id="dataset123",
            version_id="version456",
            examples=[
                v1.DatasetExample(
                    id="ex1",
                    input={"text": "hello"},
                    output={"response": "hi"},
                    metadata={"source": "test"},
                    updated_at="2024-01-15T10:00:00",
                ),
                v1.DatasetExample(
                    id="ex2",
                    input={"text": "world"},
                    output={"response": "earth"},
                    metadata={"source": "test"},
                    updated_at="2024-01-15T10:00:00",
                ),
            ],
        )

    def test_properties(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)

        assert dataset.id == "dataset123"
        assert dataset.name == "Test Dataset"
        assert dataset.description == "A test dataset"
        assert dataset.version_id == "version456"
        assert len(dataset.examples) == 2
        assert dataset.metadata == {"key": "value"}
        assert dataset.example_count == 2
        assert isinstance(dataset.created_at, datetime)
        assert isinstance(dataset.updated_at, datetime)

    def test_sequence_operations(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)

        assert len(dataset) == 2
        assert dataset[0]["id"] == "ex1"
        assert dataset[1]["id"] == "ex2"

        examples = list(dataset)
        assert len(examples) == 2
        assert all(isinstance(ex, dict) for ex in examples)

    def test_to_dataframe(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)
        df = dataset.to_dataframe()

        assert isinstance(df, pd.DataFrame)
        assert len(df) == 2
        assert list(df.columns) == ["input", "output", "metadata"]
        assert df.index.name == "example_id"  # pyright: ignore[reportUnknownMemberType]
        assert list(df.index) == ["ex1", "ex2"]  # pyright: ignore[reportUnknownMemberType,reportUnknownArgumentType]

    def test_to_dataframe_no_pandas(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)

        with patch("builtins.__import__", side_effect=ImportError("No pandas")):
            with pytest.raises(ImportError, match="pandas is required"):
                dataset.to_dataframe()

    def test_repr(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)
        repr_str = repr(dataset)
        assert "Dataset(" in repr_str
        assert "id='dataset123'" in repr_str
        assert "name='Test Dataset'" in repr_str


class TestDatasetKeys:
    def test_valid_keys(self) -> None:
        keys = DatasetKeys(
            input_keys=frozenset(["a", "b"]),
            output_keys=frozenset(["c"]),
            metadata_keys=frozenset(["d", "e"]),
        )
        assert keys.input == frozenset(["a", "b"])
        assert keys.output == frozenset(["c"])
        assert keys.metadata == frozenset(["d", "e"])
        assert set(keys) == {"a", "b", "c", "d", "e"}

    def test_overlapping_keys_validation(self) -> None:
        with pytest.raises(ValueError, match="Input and output keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a", "b"]),
                output_keys=frozenset(["b", "c"]),
                metadata_keys=frozenset(["d"]),
            )

    def test_check_differences(self) -> None:
        keys = DatasetKeys(
            input_keys=frozenset(["a"]),
            output_keys=frozenset(["b"]),
            metadata_keys=frozenset(["c"]),
        )

        keys.check_differences(frozenset(["a", "b", "c", "d"]))

        with pytest.raises(ValueError, match="Keys not found"):
            keys.check_differences(frozenset(["a", "b"]))

    def test_valid_keys_with_splits(self) -> None:
        """Test DatasetKeys with split_keys included."""
        keys = DatasetKeys(
            input_keys=frozenset(["a", "b"]),
            output_keys=frozenset(["c"]),
            metadata_keys=frozenset(["d", "e"]),
            split_keys=frozenset(["split", "category"]),
        )
        assert keys.input == frozenset(["a", "b"])
        assert keys.output == frozenset(["c"])
        assert keys.metadata == frozenset(["d", "e"])
        assert keys.split == frozenset(["split", "category"])
        assert set(keys) == {"a", "b", "c", "d", "e", "split", "category"}

    def test_split_keys_overlap_with_input(self) -> None:
        """Test that split keys cannot overlap with input keys."""
        with pytest.raises(ValueError, match="Input and split keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a", "b"]),
                output_keys=frozenset(["c"]),
                metadata_keys=frozenset(["d"]),
                split_keys=frozenset(["b", "split"]),  # 'b' overlaps with input
            )

    def test_split_keys_overlap_with_output(self) -> None:
        """Test that split keys cannot overlap with output keys."""
        with pytest.raises(ValueError, match="Output and split keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a"]),
                output_keys=frozenset(["b", "c"]),
                metadata_keys=frozenset(["d"]),
                split_keys=frozenset(["c", "split"]),  # 'c' overlaps with output
            )

    def test_split_keys_overlap_with_metadata(self) -> None:
        """Test that split keys cannot overlap with metadata keys."""
        with pytest.raises(ValueError, match="Metadata and split keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a"]),
                output_keys=frozenset(["b"]),
                metadata_keys=frozenset(["c", "d"]),
                split_keys=frozenset(["d", "split"]),  # 'd' overlaps with metadata
            )

    def test_check_differences_with_split_keys(self) -> None:
        """Test that check_differences validates split keys exist in available columns."""
        keys = DatasetKeys(
            input_keys=frozenset(["a"]),
            output_keys=frozenset(["b"]),
            metadata_keys=frozenset(["c"]),
            split_keys=frozenset(["split"]),
        )

        # Should pass when all keys including split are present
        keys.check_differences(frozenset(["a", "b", "c", "split", "extra"]))

        # Should fail when split key is missing
        with pytest.raises(ValueError, match="Keys not found"):
            keys.check_differences(frozenset(["a", "b", "c"]))  # 'split' missing

    def test_empty_split_keys(self) -> None:
        """Test DatasetKeys with empty split_keys (default behavior)."""
        keys = DatasetKeys(
            input_keys=frozenset(["a"]),
            output_keys=frozenset(["b"]),
            metadata_keys=frozenset(["c"]),
            # split_keys not provided, should default to empty frozenset
        )
        assert keys.split == frozenset()
        assert set(keys) == {"a", "b", "c"}


class TestHelperFunctions:
    def test_parse_datetime(self) -> None:
        dt = _parse_datetime("2024-01-15T10:30:00")
        assert dt.year == 2024
        assert dt.month == 1
        assert dt.day == 15
        assert dt.hour == 10
        assert dt.minute == 30

    def test_is_all_dict(self) -> None:
        assert _is_all_dict([{"a": 1}, {"b": 2}])
        assert not _is_all_dict([{"a": 1}, "not a dict"])
        assert _is_all_dict([])

    def test_is_valid_dataset_example(self) -> None:
        valid_example = v1.DatasetExample(
            id="ex1",
            input={"text": "hello"},
            output={"response": "hi"},
            metadata={"source": "test"},
            updated_at="2024-01-15T10:00:00",
        )
        assert _is_input_dataset_example(valid_example)
        assert not _is_input_dataset_example({"incomplete": "dict"})
        assert not _is_input_dataset_example("not a dict")

    def test_get_csv_column_headers(self) -> None:
        csv_content = "col1,col2,col3\nval1,val2,val3\n"

        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True

        with patch("builtins.open", mock_open(read_data=csv_content)):
            headers = _get_csv_column_headers(mock_path)
            assert headers == ("col1", "col2", "col3")

    def test_get_csv_column_headers_errors(self) -> None:
        # Test empty file
        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True

        with patch("builtins.open", mock_open(read_data="")):
            with pytest.raises(ValueError, match="CSV file has no data rows"):
                _get_csv_column_headers(mock_path)

        # Test file not found
        mock_path.is_file.return_value = False
        with pytest.raises(FileNotFoundError):
            _get_csv_column_headers(mock_path)

    def test_infer_keys(self) -> None:
        # Test with DataFrame
        df = pd.DataFrame(
            {"input1": [1, 2], "input2": [3, 4], "response": [5, 6], "metadata1": [7, 8]}
        )

        input_keys, output_keys, metadata_keys = _infer_keys(df)

        assert input_keys == ("input1", "input2")
        assert output_keys == ("response",)
        assert metadata_keys == ("metadata1",)

        # Test with mocked CSV file by patching _get_csv_column_headers
        expected_headers = ("feature1", "feature2", "output", "extra")

        with patch(
            "phoenix.client.resources.datasets._get_csv_column_headers",
            return_value=expected_headers,
        ):
            input_keys, output_keys, metadata_keys = _infer_keys("/fake/path.csv")

            assert input_keys == ("feature1", "feature2")
            assert output_keys == ("output",)
            assert metadata_keys == ("extra",)

    def test_prepare_csv(self) -> None:
        csv_content = "input1,input2,output\nval1,val2,val3\n"
        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True
        mock_path.name = "test.csv"

        keys = DatasetKeys(
            input_keys=frozenset(["input1", "input2"]),
            output_keys=frozenset(["output"]),
            metadata_keys=frozenset(),
        )

        # Mock both text and binary file operations
        with patch("builtins.open", mock_open(read_data=csv_content)) as mock_file:
            # Configure mock to return bytes when opened in binary mode
            mock_file.return_value.read.return_value = csv_content.encode()

            name, file_obj, content_type, headers = _prepare_csv(mock_path, keys)

            assert name == "test.csv"
            assert content_type == "text/csv"
            assert headers == {"Content-Encoding": "gzip"}

            file_obj.seek(0)
            decompressed = gzip.decompress(file_obj.read()).decode()
            assert decompressed == csv_content

    def test_prepare_csv_validation(self) -> None:
        csv_content = "col1,col1,col2\nval1,val2,val3\n"
        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True

        keys = DatasetKeys(
            input_keys=frozenset(["col1"]),
            output_keys=frozenset(),
            metadata_keys=frozenset(),
        )

        with patch("builtins.open", mock_open(read_data=csv_content)):
            with pytest.raises(ValueError, match="Duplicate column headers"):
                _prepare_csv(mock_path, keys)

    def test_prepare_dataframe_as_json(self) -> None:
        df = pd.DataFrame({"input": ["a", "b"], "output": ["x", "y"], "metadata": ["m1", "m2"]})

        keys = DatasetKeys(
            input_keys=frozenset(["input"]),
            output_keys=frozenset(["output"]),
            metadata_keys=frozenset(["metadata"]),
        )

        name, file_obj, content_type, headers = _prepare_dataframe_as_csv(df, keys)

        assert name == "dataframe.csv"
        assert content_type == "text/csv"
        assert headers == {"Content-Encoding": "gzip"}

        file_obj.seek(0)
        decompressed = gzip.decompress(file_obj.read()).decode()
        assert "input,output,metadata" in decompressed  # CSV header
        assert "a,x,m1" in decompressed
        assert "b,y,m2" in decompressed

    def test_prepare_dataframe_validation(self) -> None:
        df = pd.DataFrame()
        keys = DatasetKeys(
            input_keys=frozenset(),
            output_keys=frozenset(),
            metadata_keys=frozenset(),
        )

        with pytest.raises(ValueError, match="DataFrame has no data"):
            _prepare_dataframe_as_csv(df, keys)


class TestDatasetUploadError:
    def test_error_message(self) -> None:
        error = DatasetUploadError("Upload failed")
        assert str(error) == "Upload failed"


class TestCSVProcessing:
    def test_csv_parsing_with_various_formats(self) -> None:
        # Test basic CSV
        basic_csv = "input,output,metadata\nhello,hi,test\nworld,earth,demo"
        df_basic = pd.read_csv(StringIO(basic_csv))  # pyright: ignore[reportUnknownMemberType]
        input_keys, output_keys, metadata_keys = _infer_keys(df_basic)
        assert input_keys == ("input",)
        assert output_keys == ("output",)
        assert metadata_keys == ("metadata",)

        # Test CSV with quoted fields containing commas
        quoted_csv = (
            'question,answer,notes\n"What is 2+2?","4","simple math"\n"What is the capital of '
            'France?","Paris","geography, Europe"'
        )
        df_quoted = pd.read_csv(StringIO(quoted_csv))  # pyright: ignore[reportUnknownMemberType]
        input_keys, output_keys, metadata_keys = _infer_keys(df_quoted)
        assert input_keys == ("question",)
        assert output_keys == ("answer",)
        assert metadata_keys == ("notes",)
        # Verify quoted field was parsed correctly
        assert df_quoted.iloc[1]["notes"] == "geography, Europe"  # pyright: ignore[reportGeneralTypeIssues]

        # Test CSV with response column detection
        response_csv = (
            "feature1,feature2,response,extra\nval1,val2,resp1,meta1\nval3,val4,resp2,meta2"
        )
        df_response = pd.read_csv(StringIO(response_csv))  # pyright: ignore[reportUnknownMemberType]
        input_keys, output_keys, metadata_keys = _infer_keys(df_response)
        assert input_keys == ("feature1", "feature2")
        assert output_keys == ("response",)
        assert metadata_keys == ("extra",)

    def test_csv_key_inference_patterns(self) -> None:
        """Test different patterns for output column detection."""
        test_cases = [
            ("input1,input2,output", ("input1", "input2"), ("output",), ()),
            ("feat1,feat2,answer", ("feat1", "feat2"), ("answer",), ()),
            ("x,y,response,meta", ("x", "y"), ("response",), ("meta",)),
            ("a,outputs,b", ("a",), ("outputs",), ("b",)),
            ("col1,col2", ("col1", "col2"), (), ()),  # No output column
        ]

        for csv_header, expected_input, expected_output, expected_metadata in test_cases:
            csv_content = (
                csv_header + "\nval1,val2" + (",val3" if csv_header.count(",") == 2 else "")
            )
            df = pd.read_csv(StringIO(csv_content))  # pyright: ignore[reportUnknownMemberType]
            input_keys, output_keys, metadata_keys = _infer_keys(df)
            assert input_keys == expected_input, f"Failed for {csv_header}"
            assert output_keys == expected_output, f"Failed for {csv_header}"
            assert metadata_keys == expected_metadata, f"Failed for {csv_header}"

    def test_dataframe_to_csv_preparation(self) -> None:
        # Create a DataFrame with complex data
        df = pd.DataFrame(
            {
                "input_text": ["What is AI?", "Define ML"],
                "input_context": ["technology", "computer science"],
                "output_answer": ["Artificial Intelligence", "Machine Learning"],
                "metadata_source": ["wiki", "textbook"],
            }
        )

        keys = DatasetKeys(
            input_keys=frozenset(["input_text", "input_context"]),
            output_keys=frozenset(["output_answer"]),
            metadata_keys=frozenset(["metadata_source"]),
        )

        name, file_obj, content_type, headers = _prepare_dataframe_as_csv(df, keys)

        assert name == "dataframe.csv"
        assert content_type == "text/csv"
        assert headers == {"Content-Encoding": "gzip"}

        file_obj.seek(0)
        decompressed = gzip.decompress(file_obj.read()).decode()

        generated_df = pd.read_csv(StringIO(decompressed))  # pyright: ignore[reportUnknownMemberType]

        # Verify structure - columns should be sorted alphabetically within each group
        # (input keys sorted, output keys sorted, metadata keys sorted)
        expected_columns = [
            "input_context",
            "input_text",
            "output_answer",
            "metadata_source",
        ]
        assert list(generated_df.columns) == expected_columns
        assert len(generated_df) == 2

        assert generated_df.iloc[0]["input_text"] == "What is AI?"  # pyright: ignore[reportGeneralTypeIssues]
        assert generated_df.iloc[1]["output_answer"] == "Machine Learning"  # pyright: ignore[reportGeneralTypeIssues]

    def test_csv_validation_edge_cases(self) -> None:
        """Test validation of problematic CSV scenarios."""
        df_with_duplicate_cols = pd.DataFrame([[1, 2, 3]], columns=["col1", "col1", "col2"])
        assert list(df_with_duplicate_cols.columns) == ["col1", "col1", "col2"]

        keys = DatasetKeys(
            input_keys=frozenset(["col1"]),
            output_keys=frozenset(["col2"]),
            metadata_keys=frozenset(),
        )

        with pytest.raises(ValueError, match="Duplicate column names in DataFrame"):
            _prepare_dataframe_as_csv(df_with_duplicate_cols, keys)

        df = pd.DataFrame({"col1": [1], "col2": [2]})
        keys_with_missing = DatasetKeys(
            input_keys=frozenset(["col1", "missing_col"]),
            output_keys=frozenset(["col2"]),
            metadata_keys=frozenset(),
        )

        with pytest.raises(ValueError, match="Keys not found"):
            keys_with_missing.check_differences(frozenset(df.columns))

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/Arize-ai/phoenix'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

test_datasets.py•19.4 KiB

import gzip
from datetime import datetime
from io import StringIO
from pathlib import Path
from typing import Any
from unittest.mock import Mock, mock_open, patch

import pandas as pd
import pytest

from phoenix.client.__generated__ import v1
from phoenix.client.resources.datasets import (
    Dataset,
    DatasetKeys,
    DatasetUploadError,
    _get_csv_column_headers,  # pyright: ignore[reportPrivateUsage]
    _infer_keys,  # pyright: ignore[reportPrivateUsage]
    _is_all_dict,  # pyright: ignore[reportPrivateUsage]
    _is_input_dataset_example,  # pyright: ignore[reportPrivateUsage]
    _parse_datetime,  # pyright: ignore[reportPrivateUsage]
    _prepare_csv,  # pyright: ignore[reportPrivateUsage]
    _prepare_dataframe_as_csv,  # pyright: ignore[reportPrivateUsage]
)


class TestDataset:
    @pytest.fixture
    def dataset_info(self) -> v1.DatasetWithExampleCount:
        return v1.DatasetWithExampleCount(
            id="dataset123",
            name="Test Dataset",
            description="A test dataset",
            metadata={"key": "value"},
            created_at="2024-01-15T10:00:00",
            updated_at="2024-01-15T11:00:00",
            example_count=2,
        )

    @pytest.fixture
    def examples_data(self) -> v1.ListDatasetExamplesData:
        return v1.ListDatasetExamplesData(
            dataset_id="dataset123",
            version_id="version456",
            examples=[
                v1.DatasetExample(
                    id="ex1",
                    input={"text": "hello"},
                    output={"response": "hi"},
                    metadata={"source": "test"},
                    updated_at="2024-01-15T10:00:00",
                ),
                v1.DatasetExample(
                    id="ex2",
                    input={"text": "world"},
                    output={"response": "earth"},
                    metadata={"source": "test"},
                    updated_at="2024-01-15T10:00:00",
                ),
            ],
        )

    def test_properties(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)

        assert dataset.id == "dataset123"
        assert dataset.name == "Test Dataset"
        assert dataset.description == "A test dataset"
        assert dataset.version_id == "version456"
        assert len(dataset.examples) == 2
        assert dataset.metadata == {"key": "value"}
        assert dataset.example_count == 2
        assert isinstance(dataset.created_at, datetime)
        assert isinstance(dataset.updated_at, datetime)

    def test_sequence_operations(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)

        assert len(dataset) == 2
        assert dataset[0]["id"] == "ex1"
        assert dataset[1]["id"] == "ex2"

        examples = list(dataset)
        assert len(examples) == 2
        assert all(isinstance(ex, dict) for ex in examples)

    def test_to_dataframe(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)
        df = dataset.to_dataframe()

        assert isinstance(df, pd.DataFrame)
        assert len(df) == 2
        assert list(df.columns) == ["input", "output", "metadata"]
        assert df.index.name == "example_id"  # pyright: ignore[reportUnknownMemberType]
        assert list(df.index) == ["ex1", "ex2"]  # pyright: ignore[reportUnknownMemberType,reportUnknownArgumentType]

    def test_to_dataframe_no_pandas(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)

        with patch("builtins.__import__", side_effect=ImportError("No pandas")):
            with pytest.raises(ImportError, match="pandas is required"):
                dataset.to_dataframe()

    def test_repr(self, dataset_info: Any, examples_data: Any) -> None:
        dataset = Dataset(dataset_info, examples_data)
        repr_str = repr(dataset)
        assert "Dataset(" in repr_str
        assert "id='dataset123'" in repr_str
        assert "name='Test Dataset'" in repr_str


class TestDatasetKeys:
    def test_valid_keys(self) -> None:
        keys = DatasetKeys(
            input_keys=frozenset(["a", "b"]),
            output_keys=frozenset(["c"]),
            metadata_keys=frozenset(["d", "e"]),
        )
        assert keys.input == frozenset(["a", "b"])
        assert keys.output == frozenset(["c"])
        assert keys.metadata == frozenset(["d", "e"])
        assert set(keys) == {"a", "b", "c", "d", "e"}

    def test_overlapping_keys_validation(self) -> None:
        with pytest.raises(ValueError, match="Input and output keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a", "b"]),
                output_keys=frozenset(["b", "c"]),
                metadata_keys=frozenset(["d"]),
            )

    def test_check_differences(self) -> None:
        keys = DatasetKeys(
            input_keys=frozenset(["a"]),
            output_keys=frozenset(["b"]),
            metadata_keys=frozenset(["c"]),
        )

        keys.check_differences(frozenset(["a", "b", "c", "d"]))

        with pytest.raises(ValueError, match="Keys not found"):
            keys.check_differences(frozenset(["a", "b"]))

    def test_valid_keys_with_splits(self) -> None:
        """Test DatasetKeys with split_keys included."""
        keys = DatasetKeys(
            input_keys=frozenset(["a", "b"]),
            output_keys=frozenset(["c"]),
            metadata_keys=frozenset(["d", "e"]),
            split_keys=frozenset(["split", "category"]),
        )
        assert keys.input == frozenset(["a", "b"])
        assert keys.output == frozenset(["c"])
        assert keys.metadata == frozenset(["d", "e"])
        assert keys.split == frozenset(["split", "category"])
        assert set(keys) == {"a", "b", "c", "d", "e", "split", "category"}

    def test_split_keys_overlap_with_input(self) -> None:
        """Test that split keys cannot overlap with input keys."""
        with pytest.raises(ValueError, match="Input and split keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a", "b"]),
                output_keys=frozenset(["c"]),
                metadata_keys=frozenset(["d"]),
                split_keys=frozenset(["b", "split"]),  # 'b' overlaps with input
            )

    def test_split_keys_overlap_with_output(self) -> None:
        """Test that split keys cannot overlap with output keys."""
        with pytest.raises(ValueError, match="Output and split keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a"]),
                output_keys=frozenset(["b", "c"]),
                metadata_keys=frozenset(["d"]),
                split_keys=frozenset(["c", "split"]),  # 'c' overlaps with output
            )

    def test_split_keys_overlap_with_metadata(self) -> None:
        """Test that split keys cannot overlap with metadata keys."""
        with pytest.raises(ValueError, match="Metadata and split keys overlap"):
            DatasetKeys(
                input_keys=frozenset(["a"]),
                output_keys=frozenset(["b"]),
                metadata_keys=frozenset(["c", "d"]),
                split_keys=frozenset(["d", "split"]),  # 'd' overlaps with metadata
            )

    def test_check_differences_with_split_keys(self) -> None:
        """Test that check_differences validates split keys exist in available columns."""
        keys = DatasetKeys(
            input_keys=frozenset(["a"]),
            output_keys=frozenset(["b"]),
            metadata_keys=frozenset(["c"]),
            split_keys=frozenset(["split"]),
        )

        # Should pass when all keys including split are present
        keys.check_differences(frozenset(["a", "b", "c", "split", "extra"]))

        # Should fail when split key is missing
        with pytest.raises(ValueError, match="Keys not found"):
            keys.check_differences(frozenset(["a", "b", "c"]))  # 'split' missing

    def test_empty_split_keys(self) -> None:
        """Test DatasetKeys with empty split_keys (default behavior)."""
        keys = DatasetKeys(
            input_keys=frozenset(["a"]),
            output_keys=frozenset(["b"]),
            metadata_keys=frozenset(["c"]),
            # split_keys not provided, should default to empty frozenset
        )
        assert keys.split == frozenset()
        assert set(keys) == {"a", "b", "c"}


class TestHelperFunctions:
    def test_parse_datetime(self) -> None:
        dt = _parse_datetime("2024-01-15T10:30:00")
        assert dt.year == 2024
        assert dt.month == 1
        assert dt.day == 15
        assert dt.hour == 10
        assert dt.minute == 30

    def test_is_all_dict(self) -> None:
        assert _is_all_dict([{"a": 1}, {"b": 2}])
        assert not _is_all_dict([{"a": 1}, "not a dict"])
        assert _is_all_dict([])

    def test_is_valid_dataset_example(self) -> None:
        valid_example = v1.DatasetExample(
            id="ex1",
            input={"text": "hello"},
            output={"response": "hi"},
            metadata={"source": "test"},
            updated_at="2024-01-15T10:00:00",
        )
        assert _is_input_dataset_example(valid_example)
        assert not _is_input_dataset_example({"incomplete": "dict"})
        assert not _is_input_dataset_example("not a dict")

    def test_get_csv_column_headers(self) -> None:
        csv_content = "col1,col2,col3\nval1,val2,val3\n"

        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True

        with patch("builtins.open", mock_open(read_data=csv_content)):
            headers = _get_csv_column_headers(mock_path)
            assert headers == ("col1", "col2", "col3")

    def test_get_csv_column_headers_errors(self) -> None:
        # Test empty file
        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True

        with patch("builtins.open", mock_open(read_data="")):
            with pytest.raises(ValueError, match="CSV file has no data rows"):
                _get_csv_column_headers(mock_path)

        # Test file not found
        mock_path.is_file.return_value = False
        with pytest.raises(FileNotFoundError):
            _get_csv_column_headers(mock_path)

    def test_infer_keys(self) -> None:
        # Test with DataFrame
        df = pd.DataFrame(
            {"input1": [1, 2], "input2": [3, 4], "response": [5, 6], "metadata1": [7, 8]}
        )

        input_keys, output_keys, metadata_keys = _infer_keys(df)

        assert input_keys == ("input1", "input2")
        assert output_keys == ("response",)
        assert metadata_keys == ("metadata1",)

        # Test with mocked CSV file by patching _get_csv_column_headers
        expected_headers = ("feature1", "feature2", "output", "extra")

        with patch(
            "phoenix.client.resources.datasets._get_csv_column_headers",
            return_value=expected_headers,
        ):
            input_keys, output_keys, metadata_keys = _infer_keys("/fake/path.csv")

            assert input_keys == ("feature1", "feature2")
            assert output_keys == ("output",)
            assert metadata_keys == ("extra",)

    def test_prepare_csv(self) -> None:
        csv_content = "input1,input2,output\nval1,val2,val3\n"
        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True
        mock_path.name = "test.csv"

        keys = DatasetKeys(
            input_keys=frozenset(["input1", "input2"]),
            output_keys=frozenset(["output"]),
            metadata_keys=frozenset(),
        )

        # Mock both text and binary file operations
        with patch("builtins.open", mock_open(read_data=csv_content)) as mock_file:
            # Configure mock to return bytes when opened in binary mode
            mock_file.return_value.read.return_value = csv_content.encode()

            name, file_obj, content_type, headers = _prepare_csv(mock_path, keys)

            assert name == "test.csv"
            assert content_type == "text/csv"
            assert headers == {"Content-Encoding": "gzip"}

            file_obj.seek(0)
            decompressed = gzip.decompress(file_obj.read()).decode()
            assert decompressed == csv_content

    def test_prepare_csv_validation(self) -> None:
        csv_content = "col1,col1,col2\nval1,val2,val3\n"
        mock_path = Mock(spec=Path)
        mock_path.resolve.return_value = mock_path
        mock_path.is_file.return_value = True

        keys = DatasetKeys(
            input_keys=frozenset(["col1"]),
            output_keys=frozenset(),
            metadata_keys=frozenset(),
        )

        with patch("builtins.open", mock_open(read_data=csv_content)):
            with pytest.raises(ValueError, match="Duplicate column headers"):
                _prepare_csv(mock_path, keys)

    def test_prepare_dataframe_as_json(self) -> None:
        df = pd.DataFrame({"input": ["a", "b"], "output": ["x", "y"], "metadata": ["m1", "m2"]})

        keys = DatasetKeys(
            input_keys=frozenset(["input"]),
            output_keys=frozenset(["output"]),
            metadata_keys=frozenset(["metadata"]),
        )

        name, file_obj, content_type, headers = _prepare_dataframe_as_csv(df, keys)

        assert name == "dataframe.csv"
        assert content_type == "text/csv"
        assert headers == {"Content-Encoding": "gzip"}

        file_obj.seek(0)
        decompressed = gzip.decompress(file_obj.read()).decode()
        assert "input,output,metadata" in decompressed  # CSV header
        assert "a,x,m1" in decompressed
        assert "b,y,m2" in decompressed

    def test_prepare_dataframe_validation(self) -> None:
        df = pd.DataFrame()
        keys = DatasetKeys(
            input_keys=frozenset(),
            output_keys=frozenset(),
            metadata_keys=frozenset(),
        )

        with pytest.raises(ValueError, match="DataFrame has no data"):
            _prepare_dataframe_as_csv(df, keys)


class TestDatasetUploadError:
    def test_error_message(self) -> None:
        error = DatasetUploadError("Upload failed")
        assert str(error) == "Upload failed"


class TestCSVProcessing:
    def test_csv_parsing_with_various_formats(self) -> None:
        # Test basic CSV
        basic_csv = "input,output,metadata\nhello,hi,test\nworld,earth,demo"
        df_basic = pd.read_csv(StringIO(basic_csv))  # pyright: ignore[reportUnknownMemberType]
        input_keys, output_keys, metadata_keys = _infer_keys(df_basic)
        assert input_keys == ("input",)
        assert output_keys == ("output",)
        assert metadata_keys == ("metadata",)

        # Test CSV with quoted fields containing commas
        quoted_csv = (
            'question,answer,notes\n"What is 2+2?","4","simple math"\n"What is the capital of '
            'France?","Paris","geography, Europe"'
        )
        df_quoted = pd.read_csv(StringIO(quoted_csv))  # pyright: ignore[reportUnknownMemberType]
        input_keys, output_keys, metadata_keys = _infer_keys(df_quoted)
        assert input_keys == ("question",)
        assert output_keys == ("answer",)
        assert metadata_keys == ("notes",)
        # Verify quoted field was parsed correctly
        assert df_quoted.iloc[1]["notes"] == "geography, Europe"  # pyright: ignore[reportGeneralTypeIssues]

        # Test CSV with response column detection
        response_csv = (
            "feature1,feature2,response,extra\nval1,val2,resp1,meta1\nval3,val4,resp2,meta2"
        )
        df_response = pd.read_csv(StringIO(response_csv))  # pyright: ignore[reportUnknownMemberType]
        input_keys, output_keys, metadata_keys = _infer_keys(df_response)
        assert input_keys == ("feature1", "feature2")
        assert output_keys == ("response",)
        assert metadata_keys == ("extra",)

    def test_csv_key_inference_patterns(self) -> None:
        """Test different patterns for output column detection."""
        test_cases = [
            ("input1,input2,output", ("input1", "input2"), ("output",), ()),
            ("feat1,feat2,answer", ("feat1", "feat2"), ("answer",), ()),
            ("x,y,response,meta", ("x", "y"), ("response",), ("meta",)),
            ("a,outputs,b", ("a",), ("outputs",), ("b",)),
            ("col1,col2", ("col1", "col2"), (), ()),  # No output column
        ]

        for csv_header, expected_input, expected_output, expected_metadata in test_cases:
            csv_content = (
                csv_header + "\nval1,val2" + (",val3" if csv_header.count(",") == 2 else "")
            )
            df = pd.read_csv(StringIO(csv_content))  # pyright: ignore[reportUnknownMemberType]
            input_keys, output_keys, metadata_keys = _infer_keys(df)
            assert input_keys == expected_input, f"Failed for {csv_header}"
            assert output_keys == expected_output, f"Failed for {csv_header}"
            assert metadata_keys == expected_metadata, f"Failed for {csv_header}"

    def test_dataframe_to_csv_preparation(self) -> None:
        # Create a DataFrame with complex data
        df = pd.DataFrame(
            {
                "input_text": ["What is AI?", "Define ML"],
                "input_context": ["technology", "computer science"],
                "output_answer": ["Artificial Intelligence", "Machine Learning"],
                "metadata_source": ["wiki", "textbook"],
            }
        )

        keys = DatasetKeys(
            input_keys=frozenset(["input_text", "input_context"]),
            output_keys=frozenset(["output_answer"]),
            metadata_keys=frozenset(["metadata_source"]),
        )

        name, file_obj, content_type, headers = _prepare_dataframe_as_csv(df, keys)

        assert name == "dataframe.csv"
        assert content_type == "text/csv"
        assert headers == {"Content-Encoding": "gzip"}

        file_obj.seek(0)
        decompressed = gzip.decompress(file_obj.read()).decode()

        generated_df = pd.read_csv(StringIO(decompressed))  # pyright: ignore[reportUnknownMemberType]

        # Verify structure - columns should be sorted alphabetically within each group
        # (input keys sorted, output keys sorted, metadata keys sorted)
        expected_columns = [
            "input_context",
            "input_text",
            "output_answer",
            "metadata_source",
        ]
        assert list(generated_df.columns) == expected_columns
        assert len(generated_df) == 2

        assert generated_df.iloc[0]["input_text"] == "What is AI?"  # pyright: ignore[reportGeneralTypeIssues]
        assert generated_df.iloc[1]["output_answer"] == "Machine Learning"  # pyright: ignore[reportGeneralTypeIssues]

    def test_csv_validation_edge_cases(self) -> None:
        """Test validation of problematic CSV scenarios."""
        df_with_duplicate_cols = pd.DataFrame([[1, 2, 3]], columns=["col1", "col1", "col2"])
        assert list(df_with_duplicate_cols.columns) == ["col1", "col1", "col2"]

        keys = DatasetKeys(
            input_keys=frozenset(["col1"]),
            output_keys=frozenset(["col2"]),
            metadata_keys=frozenset(),
        )

        with pytest.raises(ValueError, match="Duplicate column names in DataFrame"):
            _prepare_dataframe_as_csv(df_with_duplicate_cols, keys)

        df = pd.DataFrame({"col1": [1], "col2": [2]})
        keys_with_missing = DatasetKeys(
            input_keys=frozenset(["col1", "missing_col"]),
            output_keys=frozenset(["col2"]),
            metadata_keys=frozenset(),
        )

        with pytest.raises(ValueError, match="Keys not found"):
            keys_with_missing.check_differences(frozenset(df.columns))