splitter_runner_test.go - Dummy reader that will return som…

/pipeline/splitter_runner_test.go

https://gitlab.com/wilane/heka · Go · 478 lines · 372 code · 70 blank · 36 comment · 25 complexity · 478150f36c9b70f9c6567e60eccf09a2 MD5 · raw file

/***** BEGIN LICENSE BLOCK *****
# This Source Code Form is subject to the terms of the Mozilla Public
# License, v. 2.0. If a copy of the MPL was not distributed with this file,
# You can obtain one at http://mozilla.org/MPL/2.0/.
#
# The Initial Developer of the Original Code is the Mozilla Foundation.
# Portions created by the Initial Developer are Copyright (C) 2012-2015
# the Initial Developer. All Rights Reserved.
#
# Contributor(s):
#   Mike Trinkala (trink@mozilla.com)
#   Mark Reid (mreid@mozilla.com)
#   Rob Miller (rmiller@mozilla.com)
#
# ***** END LICENSE BLOCK *****/

package pipeline

import (
	"bytes"
	"io"
	"io/ioutil"
	"path/filepath"
	"strings"

	"github.com/mozilla-services/heka/message"
	ts "github.com/mozilla-services/heka/pipeline/testsupport"
	"github.com/rafrombrc/gomock/gomock"
	gs "github.com/rafrombrc/gospec/src/gospec"
)

// Dummy reader that will return some data along with the EOF error.
type MockDataReader struct {
	data []byte
	ptr  int
}

func (d *MockDataReader) Read(p []byte) (n int, err error) {
	var start = d.ptr
	d.ptr += len(p)
	if d.ptr >= len(d.data) {
		d.ptr = len(d.data)
		copy(p, d.data[start:])
		return (d.ptr - start), io.EOF
	}
	copy(p, d.data[start:d.ptr])
	return (d.ptr - start), nil
}

func (d *MockDataReader) Append(p []byte) {
	newData := make([]byte, len(d.data)+len(p))
	copy(newData, d.data)
	copy(newData[len(d.data):], p)
	d.data = newData
}

func makeMockReader(data []byte) (d *MockDataReader) {
	d = new(MockDataReader)
	d.data = make([]byte, len(data))
	d.ptr = 0
	copy(d.data, data)
	return
}

type MultiReadReader struct {
	data0     []byte
	data1     []byte
	ptr       int
	firstDone bool
}

func (mr *MultiReadReader) read(p []byte, data []byte) (n int) {
	start := mr.ptr
	mr.ptr += len(p)
	if mr.ptr >= len(data) {
		mr.ptr = len(data)
		copy(p, data[start:])
	} else {
		copy(p, data[start:mr.ptr])
	}
	return mr.ptr - start
}

func (mr *MultiReadReader) Read(p []byte) (n int, err error) {
	if !mr.firstDone {
		n = mr.read(p, mr.data0)
		if mr.ptr >= len(mr.data0) {
			mr.firstDone = true
			mr.ptr = 0
		}
		return n, nil
	}

	// On second buffer now.
	n = mr.read(p, mr.data1)
	if mr.ptr >= len(mr.data1) {
		err = io.EOF
	}
	return n, err
}

func makeMultiReadReader(data []byte) (mr *MultiReadReader) {
	mr = &MultiReadReader{}
	idxHalf := len(data) / 2
	mr.data0 = make([]byte, idxHalf)
	mr.data1 = make([]byte, len(data)-idxHalf)
	mr.ptr = 0
	copy(mr.data0, data[:idxHalf])
	copy(mr.data1, data[idxHalf:])
	return
}

func readRecordsFromStream(sr *sRunner, reader io.Reader, getRemaining bool) (count int,
	errCount int, bytesRead int, foundEOFCount int, remainingDataLength int,
	finalRecordLength int, eofRecordLength int) {
	done := false
	for !done {
		n, record, err := (*sr).GetRecordFromStream(reader)
		if len(record) > 0 {
			count += 1
			finalRecordLength = len(record)
		}
		bytesRead += n
		if err != nil {
			if err == io.EOF {
				foundEOFCount = count
				eofRecordLength = len(record)

				if getRemaining {
					rem := (*sr).GetRemainingData()
					remainingDataLength = len(rem)
				}
				done = true
			} else {
				errCount++
				continue
			}
		}
	}
	return
}

func SplitterRunnerSpec(c gs.Context) {
	t := &ts.SimpleT{}
	ctrl := gomock.NewController(t)
	defer ctrl.Finish()

	srConfig := CommonSplitterConfig{}

	c.Specify("A SplitterRunner w/ HekaFramingSplitter", func() {
		splitter := &HekaFramingSplitter{}
		config := splitter.ConfigStruct().(*HekaFramingSplitterConfig)
		useMsgBytes := true
		srConfig.UseMsgBytes = &useMsgBytes
		sr := NewSplitterRunner("HekaFramingSplitter", splitter, srConfig)
		splitter.SetSplitterRunner(sr)

		err := splitter.Init(config)
		c.Assume(err, gs.IsNil)

		b, err := ioutil.ReadFile(filepath.Join(".", "testsupport", "multi.dat"))
		c.Assume(err, gs.IsNil)
		reader := makeMockReader(b)

		c.Specify("correctly handles data at EOF", func() {
			count, errCount, bytesRead, foundEOFCount,
				remainingDataLength, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader, true)

			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 50)
			c.Expect(foundEOFCount, gs.Equals, 50)
			c.Expect(remainingDataLength, gs.Equals, 0)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)
			c.Expect(bytesRead, gs.Equals, len(b))
		})

		c.Specify("correctly splits & unframes a protobuf stream", func() {
			ir := NewMockInputRunner(ctrl)
			sr.SetInputRunner(ir)
			recycleChan := make(chan *PipelinePack, 1)
			pack := NewPipelinePack(recycleChan)
			recycleChan <- pack
			numRecs := 50
			ir.EXPECT().InChan().Times(numRecs).Return(recycleChan)
			delCall := ir.EXPECT().Deliver(pack).Times(numRecs)
			delCall.Do(func(pack *PipelinePack) {
				pack.Recycle(nil)
			})

			for err == nil {
				err = sr.SplitStream(reader, nil)
			}
			c.Expect(err, gs.Equals, io.EOF)
		})

		c.Specify("correctly handles appends after EOF", func() {
			half := len(b) / 2
			reader := makeMockReader(b[:half])
			totalBytesRead := 0

			count, errCount, bytesRead, foundEOFCount, _, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader, false)
			totalBytesRead += bytesRead

			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 25)
			c.Expect(foundEOFCount, gs.Equals, 25)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)
			c.Expect(bytesRead <= half, gs.IsTrue)

			reader.Append(b[half:])

			count, errCount, bytesRead, foundEOFCount,
				remainingDataLength, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader, true)
			totalBytesRead += bytesRead
			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 25)
			c.Expect(foundEOFCount, gs.Equals, 25)
			c.Expect(remainingDataLength, gs.Equals, 0)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)

			c.Expect(totalBytesRead, gs.Equals, len(b))
		})

		c.Specify("reuse on another stream without GetRemainingData", func() {
			// Test the case where we reuse the same SplitterRunner on
			// two different readers, and we do not call GetRemainingData before
			// using the second reader.
			half := len(b) / 2
			reader1 := makeMockReader(b[:half])

			count, errCount, bytesRead, foundEOFCount, _, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader1, false)

			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 25)
			c.Expect(foundEOFCount, gs.Equals, 25)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)

			leftovers := half - bytesRead
			c.Expect(leftovers > 0, gs.IsTrue)

			reader2 := makeMockReader(b)

			// Don't call GetRemainingData before using sr on a new stream
			count, errCount, bytesRead, foundEOFCount, remainingDataLength, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader2, true)

			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 50)
			c.Expect(foundEOFCount, gs.Equals, 50)
			c.Expect(remainingDataLength, gs.Equals, 0)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)
			// sr misreports the "remaining data" piece from reader1 as being
			// read from reader2
			c.Expect(bytesRead, gs.Equals, len(b)+leftovers)
		})

		c.Specify("reuse on another stream with reset", func() {
			// Test the case where we reuse the same SplitterRunner on
			// two different readers, but we call GetRemainingData before using
			// the second reader.
			half := len(b) / 2
			reader1 := makeMockReader(b[:half])

			count, errCount, bytesRead, foundEOFCount, _, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader1, false)

			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 25)
			c.Expect(foundEOFCount, gs.Equals, 25)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)

			leftovers := half - bytesRead
			c.Expect(leftovers > 0, gs.IsTrue)

			reader2 := makeMockReader(b)

			// Call GetRemainingData before using sr on a new stream
			sr.GetRemainingData()
			count, errCount, bytesRead, foundEOFCount, remainingDataLength, finalRecordLength,
				eofRecordLength := readRecordsFromStream(sr, reader2, true)

			c.Expect(errCount, gs.Equals, 0)
			c.Expect(count, gs.Equals, 50)
			c.Expect(foundEOFCount, gs.Equals, 50)
			c.Expect(remainingDataLength, gs.Equals, 0)
			c.Expect(finalRecordLength, gs.Equals, 215)
			c.Expect(eofRecordLength, gs.Equals, 0)
			// Now we see the correct number of bytes being read.
			c.Expect(bytesRead, gs.Equals, len(b))
		})
	})

	c.Specify("A SplitterRunner w/ TokenSplitter", func() {
		splitter := &TokenSplitter{}
		config := splitter.ConfigStruct().(*TokenSplitterConfig)

		c.Specify("sets readPos to 0 when read returns ErrShortBuffer", func() {
			config.Delimiter = "\t"
			err := splitter.Init(config)
			c.Assume(err, gs.IsNil)

			sr := NewSplitterRunner("TokenSplitter", splitter, srConfig)

			b := make([]byte, message.MAX_RECORD_SIZE+1)
			reader := bytes.NewReader(b)

			var n int
			var record []byte
			for err == nil {
				n, record, err = sr.GetRecordFromStream(reader)
			}
			c.Expect(n, gs.Equals, int(message.MAX_RECORD_SIZE))
			c.Expect(len(record), gs.Equals, 0)
			c.Expect(err, gs.Equals, io.ErrShortBuffer)
			c.Expect(sr.readPos, gs.Equals, 0)
			c.Expect(sr.scanPos, gs.Equals, 0)
		})

		c.Specify("checks if splitter honors 'deliver_incomplete_final' setting", func() {

			config.Count = 4
			numRecs := 10
			err := splitter.Init(config)
			c.Assume(err, gs.IsNil)

			packSupply := make(chan *PipelinePack, 1)
			pack := NewPipelinePack(packSupply)
			packSupply <- pack
			ir := NewMockInputRunner(ctrl)
			// ir.EXPECT().InChan().Return(packSupply).Times(numRecs)
			// ir.EXPECT().Name().Return("foo").Times(numRecs)
			ir.EXPECT().InChan().Return(packSupply).AnyTimes()
			ir.EXPECT().Name().Return("foo").AnyTimes()

			incompleteFinal := true
			srConfig.IncompleteFinal = &incompleteFinal
			sr := NewSplitterRunner("TokenSplitter", splitter, srConfig)
			sr.ir = ir

			rExpected := []byte("test1\ntest12\ntest123\npartial\n")
			buf := bytes.Repeat(rExpected, numRecs)
			buf = buf[:len(buf)-1] // 40 lines separated by 39 newlines

			reader := bytes.NewReader(buf)
			mockDel := NewMockDeliverer(ctrl)
			delCall := mockDel.EXPECT().Deliver(gomock.Any()).AnyTimes()
			i := 0
			delCall.Do(func(pack *PipelinePack) {
				i++
				if i < numRecs {
					c.Expect(pack.Message.GetPayload(), gs.Equals, string(rExpected))
				} else {
					c.Expect(pack.Message.GetPayload(), gs.Equals,
						string(rExpected[:len(rExpected)-1]))
				}
				pack.Recycle(nil)
			})
			c.Specify("via SplitStream", func() {
				for err == nil {
					err = sr.SplitStream(reader, mockDel)
				}
				c.Expect(err, gs.Equals, io.EOF)
				c.Expect(i, gs.Equals, numRecs)
			})
			c.Specify("via SplitBytes", func() {
				seekPos, err := sr.SplitBytes(buf, mockDel)
				c.Assume(err, gs.IsNil)
				c.Expect(seekPos, gs.Equals, len(buf))
				c.Expect(i, gs.Equals, numRecs)
			})
		})
	})

	c.Specify("A SplitterRunner w/ NullSplitter", func() {
		splitter := &NullSplitter{}
		config := struct{}{}

		c.Specify("reads to EOF when 'ToEOF' call is used", func() {
			err := splitter.Init(config)
			c.Assume(err, gs.IsNil)

			// Create SplitterRunner w/ mock InputRunner
			sr := NewSplitterRunner("TokenSplitter", splitter, srConfig)
			ir := NewMockInputRunner(ctrl)
			sr.SetInputRunner(ir)
			recycleChan := make(chan *PipelinePack, 1)
			pack := NewPipelinePack(recycleChan)
			recycleChan <- pack
			ir.EXPECT().InChan().Return(recycleChan)
			ir.EXPECT().Name().Return("InputRunnerName")

			// Create reader that will always require multiple reads.
			s := "0123456789"
			b := bytes.Repeat([]byte(s), 100)
			reader := makeMultiReadReader(b)

			// Set up deliverer that will return the pack back to us.
			delChan := make(chan *PipelinePack, 1)
			delFunc := func(pack *PipelinePack) {
				delChan <- pack
			}
			del := &deliverer{
				deliver: delFunc,
			}

			errChan := make(chan error, 1)
			go func() {
				err := sr.SplitStreamNullSplitterToEOF(reader, del)
				errChan <- err
			}()

			pack = <-delChan
			c.Expect(pack.Message.GetPayload(), gs.Equals, string(b))

			err = <-errChan
			c.Expect(err, gs.Equals, io.EOF)
		})

		c.Specify("only reads once when regular `SplitStream` call is used", func() {
			err := splitter.Init(config)
			c.Assume(err, gs.IsNil)

			// Create SplitterRunner w/ mock InputRunner
			sr := NewSplitterRunner("TokenSplitter", splitter, srConfig)
			ir := NewMockInputRunner(ctrl)
			sr.SetInputRunner(ir)
			recycleChan := make(chan *PipelinePack, 2)
			pack0 := NewPipelinePack(recycleChan)
			pack1 := NewPipelinePack(recycleChan)
			recycleChan <- pack0
			recycleChan <- pack1
			ir.EXPECT().InChan().Return(recycleChan).Times(2)
			ir.EXPECT().Name().Return("InputRunnerName").Times(2)

			// Create reader that will always require multiple reads.
			s := "0123456789"
			b := make([]byte, 1000)
			copy(b[:500], strings.Repeat(s, 50))
			copy(b[500:510], "FFFFFFFFFF") // So the first and second half aren't identical.
			copy(b[510:], strings.Repeat(s, 49))
			reader := makeMultiReadReader(b)

			// Set up deliverer that will return the pack back to us.
			delChan := make(chan *PipelinePack, 1)
			delFunc := func(pack *PipelinePack) {
				delChan <- pack
			}
			del := &deliverer{
				deliver: delFunc,
			}

			errChan := make(chan error, 1)
			go func() {
				err := sr.SplitStream(reader, del)
				errChan <- err
			}()

			pack := <-delChan
			c.Expect(pack.Message.GetPayload(), gs.Equals, string(b)[:500])
			pack = <-delChan
			c.Expect(pack.Message.GetPayload(), gs.Equals, string(b)[500:])

			err = <-errChan
			c.Expect(err, gs.Equals, io.EOF)
		})

	})
}
Tech Fingerprint

Alerts (5)

Complexity hotspot; lines 124 to 125 (total complexity: 4)
124 125
'if err != nil {' Ensure errors are handled or logged
124
'path.Join(' Can cause issues on Windows consider filepath.Join instead
161
'ioutil.ReadFile' Deprecated: As of Go 1.16, see io or os packages for replacement
161