@arizeai/phoenix-mcp

Official

Overview Schema Related Servers Score Discussions

test_rate_limiters.py•5.41 KiB

import time from collections.abc import Callable, Iterator from contextlib import contextmanager from typing import Optional from unittest import mock import pytest from phoenix.server.rate_limiters import ServerRateLimiter, TokenBucket, UnavailableTokensError @contextmanager def freeze_time(frozen_time: Optional[float] = None) -> Iterator[Callable[[], None]]: frozen_time = time.time() if frozen_time is None else frozen_time with mock.patch("time.time") as mock_time: mock_time.return_value = frozen_time yield mock_time @contextmanager def warp_time(start: float) -> Iterator[None]: sleeps: list[float] = [0] current_time = start start = time.time() if start is None else start def instant_sleep(time: float) -> None: nonlocal sleeps sleeps.append(time) def time_warp() -> float: try: nonlocal current_time nonlocal sleeps current_time += sleeps.pop() return current_time except IndexError: return current_time with mock.patch("time.time") as mock_time: with mock.patch("time.sleep") as mock_sleep: mock_sleep.side_effect = instant_sleep mock_time.side_effect = time_warp yield None def test_token_bucket_gains_tokens_over_time() -> None: start = time.time() with freeze_time(start): bucket = TokenBucket(per_second_request_rate=1, enforcement_window_seconds=30) bucket.tokens = 0 # start at 0 with freeze_time(start + 5): assert bucket.available_tokens() == 5 with freeze_time(start + 10): assert bucket.available_tokens() == 10 def test_token_bucket_can_max_out_on_requests() -> None: start = time.time() with freeze_time(start): bucket = TokenBucket(per_second_request_rate=1, enforcement_window_seconds=120) bucket.tokens = 0 # start at 0 with freeze_time(start + 30): assert bucket.available_tokens() == 30 with freeze_time(start + 120): assert bucket.available_tokens() == 120 with freeze_time(start + 130): assert bucket.available_tokens() == 120 # should max out at 120 def test_token_bucket_spends_tokens() -> None: start = time.time() with freeze_time(start): bucket = TokenBucket(per_second_request_rate=1, enforcement_window_seconds=10) bucket.tokens = 0 # start at 0 with freeze_time(start + 3): assert bucket.available_tokens() == 3 bucket.make_request_if_ready() assert bucket.available_tokens() == 2 def test_token_bucket_cannot_spend_unavailable_tokens() -> None: start = time.time() with freeze_time(start): bucket = TokenBucket(per_second_request_rate=1, enforcement_window_seconds=2) bucket.tokens = 0 # start at 0 with freeze_time(start + 1): assert bucket.available_tokens() == 1 bucket.make_request_if_ready() # should spend one token with pytest.raises(UnavailableTokensError): bucket.make_request_if_ready() # should raise since no tokens left def test_rate_limiter_cleans_up_old_partitions() -> None: start = time.time() with freeze_time(start): limiter = ServerRateLimiter( per_second_rate_limit=1, enforcement_window_seconds=100, partition_seconds=10, active_partitions=2, ) limiter.make_request("test_key_1") limiter.make_request("test_key_2") limiter.make_request("test_key_3") limiter.make_request("test_key_4") partition_sizes = [len(partition) for partition in limiter.cache_partitions] assert sum(partition_sizes) == 4 interval = limiter.partition_seconds with freeze_time(start + interval): # after a partition interval, the cache rolls over to a second active partition limiter.make_request("test_key_4") # moves test_key_4 to current partition limiter.make_request("test_key_5") # creates test_key_5 in current partition partition_sizes = [len(partition) for partition in limiter.cache_partitions] assert sum(partition_sizes) == 5 assert 2 in partition_sizes # two rate limiters in current cache partition assert 3 in partition_sizes # three rate limiters remaining in original partition with freeze_time(start + interval + (limiter.num_partitions * interval)): limiter.make_request("fresh_key") # when "looping" partitions, cache should be reset assert sum(len(partition) for partition in limiter.cache_partitions) == 1 def test_rate_limiter_caches_token_buckets() -> None: start = time.time() with freeze_time(start): limiter = ServerRateLimiter( per_second_rate_limit=0.5, enforcement_window_seconds=20, partition_seconds=1, active_partitions=2, ) limiter.make_request("test_key") limiter.make_request("test_key") limiter.make_request("test_key") token_bucket = None for partition in limiter.cache_partitions: if "test_key" in partition: token_bucket = partition["test_key"] break assert token_bucket is not None, "Token bucket for 'test_key' should exist" assert token_bucket.tokens == 7 with freeze_time(start + 1): assert token_bucket.available_tokens() == 7.5 limiter.make_request("test_key") assert token_bucket.tokens == 6.5

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/Arize-ai/phoenix'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

test_rate_limiters.py•5.41 KiB