MCP Memory LibSQL Go

Overview Schema Related Servers Score Discussions

ollama.go•4.76 KiB

package embeddings import ( "bytes" "context" "encoding/json" "errors" "fmt" "net" "net/http" "net/url" "os" "path" "strconv" "strings" "time" ) type ollamaProvider struct { host string model string dims int http *http.Client } func newOllamaFromEnv() Provider { host := os.Getenv("OLLAMA_HOST") if host == "" { return nil } model := os.Getenv("OLLAMA_EMBEDDINGS_MODEL") if model == "" { model = "nomic-embed-text" } dims := 768 // Allow configuring HTTP timeout; default to 60s to tolerate cold model loads // OLLAMA_HTTP_TIMEOUT supports Go duration (e.g., "60s") or plain seconds (e.g., "60"). timeout := 60 * time.Second if v := strings.TrimSpace(os.Getenv("OLLAMA_HTTP_TIMEOUT")); v != "" { if d, err := time.ParseDuration(v); err == nil { timeout = d } else if n, err2 := strconv.Atoi(v); err2 == nil { timeout = time.Duration(n) * time.Second } } else if v := strings.TrimSpace(os.Getenv("EMBEDDINGS_HTTP_TIMEOUT")); v != "" { // compatibility alias if d, err := time.ParseDuration(v); err == nil { timeout = d } else if n, err2 := strconv.Atoi(v); err2 == nil { timeout = time.Duration(n) * time.Second } } return &ollamaProvider{host: host, model: model, dims: dims, http: &http.Client{Timeout: timeout}} } func (p *ollamaProvider) Name() string { return "ollama" } func (p *ollamaProvider) Dimensions() int { return p.dims } func (p *ollamaProvider) Embed(ctx context.Context, inputs []string) ([][]float32, error) { if len(inputs) == 0 { return [][]float32{}, nil } // Prefer new /api/embed (v0.2.6+); fall back to /api/embeddings reqBody := map[string]any{"model": p.model, "input": inputs} body, _ := json.Marshal(reqBody) base, err := url.Parse(p.host) if err != nil { return nil, err } // Try /api/embed first with a brief retry on client timeouts (cold model start) embedURL := *base embedURL.Path = path.Join(embedURL.Path, "/api/embed") doPost := func() (*http.Response, error) { req, rerr := http.NewRequestWithContext(ctx, http.MethodPost, embedURL.String(), bytes.NewReader(body)) if rerr != nil { return nil, rerr } req.Header.Set("Content-Type", "application/json") return p.http.Do(req) } resp, err := doPost() if err != nil { // Retry once on timeout if isTimeout(err) || errors.Is(err, context.DeadlineExceeded) { resp, err = doPost() } if err != nil { return nil, err } } // If not 200, try legacy endpoint if resp.StatusCode == http.StatusNotFound || resp.StatusCode == http.StatusMethodNotAllowed { resp.Body.Close() legacyURL := *base legacyURL.Path = path.Join(legacyURL.Path, "/api/embeddings") req2, _ := http.NewRequestWithContext(ctx, http.MethodPost, legacyURL.String(), bytes.NewReader(body)) req2.Header.Set("Content-Type", "application/json") resp, err = p.http.Do(req2) if err != nil { return nil, err } } defer resp.Body.Close() if resp.StatusCode < 200 || resp.StatusCode >= 300 { var b struct { Error string `json:"error"` } _ = json.NewDecoder(resp.Body).Decode(&b) if b.Error != "" { return nil, fmt.Errorf("ollama error: %s", b.Error) } return nil, fmt.Errorf("ollama http status: %s", resp.Status) } // Accept both shapes var outEmbed struct { Embeddings [][]float32 `json:"embeddings"` } if err := json.NewDecoder(resp.Body).Decode(&outEmbed); err == nil && len(outEmbed.Embeddings) > 0 { return outEmbed.Embeddings, nil } // Legacy single embedding shape var outLegacy struct { Embedding []float64 `json:"embedding"` } if err := json.NewDecoder(bytes.NewReader([]byte{})).Decode(&outLegacy); err != nil { // Already consumed body; fallback by re-reading is complex; simplest path: reissue once with single input } // As a robust fallback: call per-input and batch results results := make([][]float32, 0, len(inputs)) for _, in := range inputs { one := map[string]any{"model": p.model, "input": in} b2, _ := json.Marshal(one) req3, _ := http.NewRequestWithContext(ctx, http.MethodPost, embedURL.String(), bytes.NewReader(b2)) req3.Header.Set("Content-Type", "application/json") r3, err := p.http.Do(req3) if err != nil { return nil, err } var single struct { Embeddings [][]float32 `json:"embeddings"` Embedding []float64 `json:"embedding"` } _ = json.NewDecoder(r3.Body).Decode(&single) r3.Body.Close() if len(single.Embeddings) > 0 { results = append(results, single.Embeddings[0]) } else if len(single.Embedding) > 0 { results = append(results, f64to32(single.Embedding)) } else { return nil, fmt.Errorf("ollama returned no embedding") } } return results, nil } // isTimeout returns true if the error represents a timeout func isTimeout(err error) bool { if err == nil { return false } var ne net.Error if errors.As(err, &ne) && ne.Timeout() { return true } return false }

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ZanzyTHEbar/mcp-memory-libsql-go'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

ollama.go•4.76 KiB